瞭望前沿、蓄势期远——行业专家系列报告之十九

报告主题:多模态感知交互在智能座舱中的应用现状及趋势

 

报告人:林垠、郭同刚

地点:C622

时间:2025年10月25日(周六)14:30

欢迎广大师生参加!

计算机与信息学院(大数据与智能现代产业学院、新一代信息技术现代产业学院)


报告内容简介:

自1886 年卡尔・本茨发明汽车以来,历经近 140 年发展,汽车已从最初的机械时代跨入智能时代。人工智能、大数据、新型传感器等大量新兴技术的出现与突破,更开辟了全新的汽车赛道。作为智能汽车的核心组成部分,智能座舱的作用不仅限于传统驾驶辅助,更通过集成人工智能、物联网、多模态交互等技术,重构人车关系,推动汽车向 “第三生活空间” 转型;而多模态交互作为智能座舱的核心技术,进一步推动人机交互范式从 “机械指令” 向 “自然感知” 实现跨越式演进。本报告将梳理智能座舱从数字化、网络化到智能化的阶段演进过程,探讨多模态感知交互技术在语音识别、视线估计、手势识别、生理监测等领域取得的显著进展,介绍相关技术在奇瑞多个车型中的规模化应用,同时也将分析单模态感知向多模态深度融合演进的研发趋势。

 

报告人简介:

林垠,高级工程师,中国科学技术大学博士。科大讯飞AI研究院视觉交互与分析研发总监,长期从事计算机视觉领域相关工作,研究方向涵盖图像理解、人脸识别、目标检测、语义分割、行为识别在内的视觉感知交互算法,同时参与到讯飞多模态大模型的算法研究,主导讯飞多模感知和交互等多项能力在智能座舱场景下交互落地应用。

郭同刚,工程师,奇瑞汽车股份有限公司产品数字化中心座舱软件开发部门主任设计师;2024年度集团科技创新奖,具有10多年座舱产品及软件开发经历,对汽车车联网,智能座舱域控制器,智能座舱软件开发及测试验证有丰富经验,熟悉当前主流智能座舱硬件平台、软件架构及开发模式。带领团队积极推进座舱智能化迭代开发,积极探索汽车智能化发展路径。

Baidu
18luck计算机版