“随着技术更深入地融入我们的生活,未来的界面是什么样的?”
(资料图片)
“你可以体验到即时、互动的语音对话……” ChatGPT之父,OpenAI首席执行官Sam Altman在接受《时代周刊》前主编Edward Felsenthal专访时认为,随着模型更深入地了解你,而且有能力做更多的事情,从相对少量的对话中解决更多问题这件事充满想象空间。
现在,这个想象的载体之一是汽车。
近日,梅赛德斯-奔驰和微软官宣正在合作测试车载ChatGPT人工智能。从6月16日开始,该功能面向美国市场约90万名奔驰车主开放,搭载了MBUX车载系统的车辆可以通过车主手机或车内操作,以OTA方式激活ChatGPT功能。
奔驰认为,大部分语音助手只能理解单次、直白的指令,联系上下文的自然对话几乎没有实现可能。但整合ChatGPT可以大幅提升车主自然语言交流的理解能力。甚至可以在它讲完一个笑话后告诉它不好笑,“再来一个”,它也能继续讲,更不用说理解“这些”“我的”这种需要语境的词汇。
ChatGPT首次“上车”的应用案例,始于车载语音助手,不过二者可以擦出火花的空间同样充满想象,比如自动驾驶领域。
▍语音助手的“温度”
国内车主对车机系统的语音交互功能并不陌生,每个品牌的交互规则不同,唤醒方式也不同。比亚迪可以用“你好,小迪”,理想汽车则是“理想同学”,蔚来提供语音和手势两种唤醒方式。
不过这些系统给用户的感觉是,只能执行预先设定的任务或答复,“不懂我”,车机就是一套冷冰冰的系统。本该是用户的惊喜体验,甚至引发了用户的抱怨。
国内领先的缺陷汽车产品信息收集及汽车消费者投诉信息受理平台车质网信息显示,语音助手无法唤醒、识别不灵敏、无法执行指令等问题频发,豪华、合资和自主品牌均有涉及。
事实上,语音交互功能的实现主要分为识别、理解和执行三个步骤。目前识别部分的技术趋于成熟,行业平均识别率可达90%,但在理解上“卡了脖子”。
用户需要按照指定命令交互,系统不具备语义理解能力,导致交互机械化,系统功能单一,命令词单一,继而影响用户体验。有用户甚至因语音助手总是误将聊天内容作为指令,关闭了这项功能。
整合了ChatGPT的车载语音交互系统,将能够利用ChatGPT在推理和学习能力上的优势,融合对话智能技术、深度学习大模型技术、大数据的潜力等,带来更流畅和有效的响应。
此外,接入生成式AI,还能够与车主进行复杂的对话。奔驰就计划根据用户的反馈持续改进系统,探索ChatGPT插件功能,让车主通过“说人话”的方式来预订餐厅或电影票,在驾驶员双手不离开方向盘的情况下,获得更为人性化的语音互动体验。
▍自动驾驶的“新范式”
ChatGPT获得广泛关注后,正在向多应用生态发展,智能座舱中语音交互功能之外,自动驾驶是另一个焦点。
目前,已经有集度、长城、东风日产、爱驰、零跑、吉利汽车等近10家车企加入百度文心一言的朋友圈;毫末智行发布了自动驾驶生成式大模型DriveGPT,帮助解决认知决策问题,最终实现端到端的自动驾驶。
理想汽车在近日举办的家庭科技日上,发布自研大模型MindGPT,摆脱对高精地图的依赖,让汽车做到更接近人类司机的驾驶表现。
蔚来、小鹏、长城、奇瑞四家车企也已经注册申请了多个与GPT相关的商标。
一直以来,自动驾驶技术的演进可以大致分为两种技术路线,Waymo等企业属于“激进派”,锚定直接实现L4/L5级别自动驾驶;特斯拉的步子反而没有那么快,在量产车上优先搭载L2/L3级别辅助驾驶,继而向高级别进化。
从目前自动驾驶公司的经营情况和资本市场的前景预测看,直接实现高级别自动驾驶的策略存在难以商业化、伦理等诸多问题,不少L4公司“降维”进入L2或是L2+领域。
而根据特斯拉的官方数据,截至2023年5月16日,特斯拉全球车队的总行驶里程数已超过1000亿英里(约1600亿公里),相当于从地球往返太阳532次,为特斯拉的自动驾驶进化提供了宝贵的数据支持。
虽然业内对L2是否能渐进到L4有争议,但ChatGPT的横空出世还是让行业看到,持续积累公里数获得的数据,是有希望实现高级别自动驾驶的。
图片来源:理想汽车官网
或许这也可以解释,为什么理想汽车宣布下半年开启通勤NOA功能时,还是收获了很多期待的留言。虽然应用场景只是点对点,但这比直指空中楼阁的L4/L5的承诺落地,起码可以让用户感受到智能驾驶到底能做到什么。
梅赛德斯-奔驰集团股份公司董事会成员及首席技术官Markus Schäfer回顾对ChatGPT的整合时说,(技术的快速迭代)让我无法预测未来9个月汽车上有什么新的东西会出现。
这才是ChatGPT对于智能座舱、自动驾驶,对于汽车的魅力所在。