微信文章
AI Companions 将改变驾驶体验
原创 Cerence China 赛轮思 3月10日
赛轮思首席技术官Prateek Kathpal做客Voicebot.ai 的10 minutes on 播客节目,分享了新一代AI Driving Companion,车载语音助手的演变,以及赛轮思新发布的沉浸式Cerence Companion独特之处,从可教AI到与汽车传感器的深度整合,创造崭新的车载语音交互场景。
以下是这期博客的节录内容:
随着语音助手变得越来越普遍,它已经被广泛应用于智能音箱、移动应用程序以及汽车中。尤其是在汽车中,其作用将更加明显。事实上,语音助手在汽车中的应用经历了20年的演变,它在新汽车时代演变中承担更为重要的新角色。从视频看来,语音助手是不是已经不能同日而语?
你在视频中看到的是我们近期发布的Cerence Companion,它的推出象征着语音助手演变迭代。此前,我们通过对话式AI实现语音交互。语音助手的早期阶段,由于机器学习还不成熟,所以我们要以自然语言理解为核心设计语音助手。现在,驾驶者需要的不仅仅是一个语音助手,他们更需要的是一个灵活的、智能的和可以交谈的助理。因此,出现了对话式AI助理。一个基于深度学习的解决方案,它了解用户,并提供一个足够直观的解决方案来为用户思考。它可以根据你是谁和对你的了解来做出反应,它也知道你要去哪里,所以与你自然对话也变得驾轻就熟。
在大约2年前,我们推出了Cerence Co-Pilot,它将对话式AI提升到了一个新的水平,我们为它增加了主动智能推荐的能力,从此AI助理不必一直处于被动状态。拥有驾驶者信息和汽车信息的助理,可以使用这些信息,并根据某些触发因素或事件(如问题)主动与用户发起对话,甚至有可能在用户犯错时,例如错过红灯或在停车标志前没有停够时间的情况下,非常礼貌地对你进行“提点”。现在你看到的视频是基于可教AI(Teachable AI)的Companion 。它与汽车、传感器和数据深度整合,并理解车内和车外的复杂情况。
在视频中,有几个用例我认为很有趣。像与日历的整合,是非常有用。很多时候,当你在开车的时候,因为你有一个约会,或者你需要联系某人。然后另一个是支付。基于这些用例,Companion与Co-Pilot 或Assistant的概念是有什么不同?
Cerence Companion是新一代的AI助理。它了解你,以及你身处车内和车外的环境。我们说过,它还可以访问你的个人资料。所以它可以与你尽可能自然地对话。但与此同时,它还扮演许多角色。例如一个行政助理,协助你度过你的工作日,例如使你能够在路上与你的同事联系,加入到你的会议中。它还可以将你的汽车连接到你的智能家居,确保家里的一切都准备好了。例如,根据你回程的时间,它可以在你到家时打开你的车库门,甚至打开灯。它还可以充当卡拉OK助手或提供娱乐节目,使你的旅程更加有趣。它也是一个汽车专家,可以指挥和控制车辆。它还可以用一种非常微妙的方式让你知道,车辆中的传感器有什么问题。因此,Companion可以扮演许多不同的角色。它甚至可以是一个管家,为你和代表你做并执行现实生活中的任务,而且是车外的任务。
Cerence Companion如何为你或代表你执行现实生活中的任务,请提供一些例子。
一个Companion可以是一个管家,你可以教它为你做某些事情,处理一些现实世界的任务。例如,为你预约理发。但与此同时,基于AI 技术,它可以结合了视线、手势和视觉的交互,AI与多模态的整合,为用户创造一个激动人心的体验。所以你可以教Companion关于你、你的喜好和选择。让我给你举个例子,比方说一个用户在车里想开启放松模式。不过刚开始,助理不知道什么能让你真正放松,所以助理回应说:“Hey,我不确定,但你能不能教我或告诉我什么能让你放松?”然后用户可以回复说:“把环境灯调为蓝色,把窗户摇起来,把温度调到一定程度,还可以播放一些音乐。”现在助理知道了这些信息,它把你的个人档案相关联。因此,下一次当你在车里时只需简单地说:“Hey,打开放松模式”,助理便会直接地执行相应的车内环境调整。
语音助理在处理对话上下文比过去几年已经迈进一大步,并在车内、车外和其他生活领域已有许多不同的用户案例。但语音助理如何获得用户的背景,历史和怎样跟驾驶者互动?
过去的助手是非常被动的。你会说例如“Hey Mercedes”或者“Hey BMW” ,唤醒系统并回答你的问题。现在的助理在本质上更加积极主动。因为他们可以获得信息,并使用AI,为你做出某些决定,需要的时候发起对话。举个例子,如果你没有在一个停车标志前停足够长的时间,助理会主动提醒,“ Hey,作为一个安全的驾驶者,你可能在这个停车标志前你应该多停一会儿。”但如果驾驶者当时正在打电话或应付其他事情,助理很聪明地待你有空的时候才继续之前的对话,并说“ Hey,在这个十字路口或这个日期和时间,你最好要停超过一秒钟。”这就是未来技术的发展方向,它不仅增加了一种新的表达方式,让交互变得更自然和人性化,而且很贴心地在有需要的时候采取主动。
这样的语音助理几乎更像一个真人助理,他们可以感知你的需要,可以用自然语言听你说话,实现多模态、多感官交互,并通过可教AI,记住了你的偏好。在CES之后,你和很多汽车制造商交流过这些新技术。他们的反应是什么?
我们刚刚在Cerence Investor Day推出了一系列新技术,并向多个传统的OEM厂商以及新的电动车制造商展示了这些新技术,总体反应是非常积极的。汽车行业本身也正在经历自己的周期。我认为这是一个时机,因为汽车的硬件也在同时改进。这将为赛轮思提供一个巨大的机会,将更先进的AI技术引入汽车。有了功能更强大的摄像头和雷达,让车内和车外环境无界限,加上对车舱内驾驶者安全监测,将成为不同地区的法规。
车舱内的驾驶者监控是肯定的。当我们回到互动方面,你刚才提到的Cerence Investor Day,你当时演示了Cerence Companion,请分享一下。
在Cerence Investor Day 上,我们向主要分析师和媒体展示的是我们的AI技术,新的AI引擎已经升级至可以进行真实世界对话的水平。Cerence Companion使对话体验自然流畅,对话另一方的人能够像与其他任何人交谈一样,可以正常自然说话,而不是与机器的呆板式答问。我们展示了一个CI的真实录音,基本上是一个语音助理代表用户打电话给纽约一家餐馆。该录音就像一个非常正常普通的对话,预订一个桌子。这个电话源自于Cerence Cloud。一旦预订被确认,信息就可以显示在用户汽车主机上,或者通过电话或电子邮件通知用户。让我为你们播放一下,这样你们就能有一个真实的体验。
正如你在录音中听到的,这是一个助理与真人真实对话的录音,一位纽约餐馆的工作人员, 他虽然刚开始并不知道自己是在和一个语音助理说话,但后来他知道了,但感觉对话还是非常自然。你可能也观察到,Companion在重复内容的时候,例如电话号码,当用户只听到一半的时候而要求助理重复时,它实际上重复了一遍电话号码,而且更多地强调了对方没有听清楚的最后四位数字。Companion不仅仅是参与对话,而是试图理解其他用户的情绪和背景,并能相应地暂停信息,把用户真正需要的东西综合起来,呈现给用户。显然,这是Companion的另一个关键因素,因为它们使用AI和深度学习,使得系统变得非常自然,不仅是对话,而且还实时向用户展示信息。
我们以前也见过这样的东西。Google duplex,看这个节目的人都会知道。它展示了类似的互动类型,但随着时间的推移,这已经变成了一个更多的演示产品。现在看来,你们已经准备好将其投入市场,并将其变成实际的生产功能。
是的,我们正在与OEM进行非常激动人心的对话,他们表现出很大的兴趣,因为应用场景很多,特别是当用户在开车的时候,想去一个餐馆,甚至去一个经销商的预约。在这种情况下,它可以在车机上弹出餐厅的信息,甚至是你也不知道的汽车信息。就像很多时候,用户会问助理“ Hey,VIN号码在哪里”,助理会开始搜索并自动弹出信息。可以看到它变得更有背景意识。但与此同时,由于它是一个云对云的对话,作为用户的你,甚至不需要告诉它车辆识别码。现在你可以简单地去打电话,并获得信息,这是在你的个人资料中,只是简单地去预约,然后在你的预约信息在屏幕上弹出。这就完成了。
一个主动、可教、有背景意识的Companion, 它拥有非常明显的价值优势,可以为用户带来颠覆性的驾驶体验,为汽车行业带来更高的价值,这就是我们正在关注的发展方向。
*以上内容翻译自Voicebot.ai官网,文中提到的商标均为其各自所有者的资产。
发现更多关于
未来出行体验
相关文章
新闻稿
赛轮思AI与英伟达扩大合作,提升CaLLM系列语言模型的能力
了解更多
新闻稿
赛轮思AI与豪华汽车制造商签署长期战略合作协议,共同打造下一代车载体验
了解更多
新闻稿
Mapbox与赛轮思AI携手合作,加速语音驱动导航的未来发展
了解更多