智言视寻

融合视觉智能与语言认知的辅助交互系统

团队：寻言智探团队

指导教师：李志刚

深度融合的智能认知架构

深度融合的智能认知架构

50%

视觉感知

通过先进的目标检测模型获取视觉原始信息，实现精准识别

语言理解

由大语言模型进行深度场景理解和语境分析，提供智能化解读

自适应智能交互系统

自动巡航模式

主动观察环境变化，实时预警潜在风险，提供全方位保护

多模态交互

支持语音、文字等多种自然交互方式，操作便捷直观

自适应智能交互系统

90%

场景理解与推理能力

场景理解与推理能力

50%

空间关系理解

深度识别物体之间的位置和互动关系，构建完整场景认知

危险预测

基于大语言模型的推理能力，提前预判潜在风险，确保安全

社会价值

助力无障碍社会建设

为视障人士提供"智能眼睛"，创造平等的信息获取机会

推动普惠科技发展

让先进技术服务更广泛的人群，促进社会进步

促进社会包容性

帮助特殊群体更好地融入社会生活，创造共融环境

未来展望

技术层面

持续优化算法性能
扩展系统认知范围
深化多模态融合技术

应用层面

拓展应用场景
开发个性化功能
探索产业化路径

社会价值

推动无障碍建设
促进科技普惠
建设包容性社会

项目演示

谢谢聆听

用科技照亮每个人的世界

1 / 8