微信文章
Just Talk!全时免唤醒对话让语音交互更接近人与人之间的自然对话
原创 Cerence China 赛轮思 4月7日
语音按钮和唤醒词长期以来都是用户与语音助手开启对话的激活方式。但是,如果你的助手知道你在跟它说话,你就不需要按下语音按钮或说 “ Hey...”了?
假如你曾经在你的车里使用过语音识别,你很有可能是按了方向盘上的说话人脸图标按钮来激活语音识别,或者是熟练地说出唤醒词,如“ Hey,(在这里说出你的汽车品牌) ”,然后说出你的问题或指令。后者由于不需要使用按钮,因此交互更自然。
我们可以将语音按钮和唤醒词激活的方法比喻做管家。想象一下,现在你想吃点零食。你敲响铃铛,管家进来了,问道:“我能为你做些什么?”你说,“给我一杯咖啡/酥脆面包配帕尔马火腿及番茄。”这里的铃声有点像语音按钮,可以呼唤你的管家待命。而当你这样说,“詹姆斯,请把我的下午茶拿来。”就像使用唤醒词激活语音助手。
进一步打个比方,想象一下你连续提出一系列的要求:“詹姆斯,给我来一份下午茶。” “詹姆斯,我也想要一点沙拉。” “詹姆斯,把它放在这里。” “詹姆斯,不,就在桌子上。” “詹姆斯,我想喝点香槟。”这个例子表明,虽然唤醒词比即按即说激活有更多优势,但在某些情况下,每次都说唤醒词是相当尴尬的。在自然交互中,你不需要每次和詹姆斯说话时都提醒他你在和他说话--如果房间里只有你和詹姆斯两个人,你可以说:“你能再给我做一份苹果丹麦酥吗?”詹姆斯会完全理解你是在和他说话,即使没有提到他的名字。
The butler analogy: different degrees of proximity of your assistant
一直以来,Cerence DRIVE Lab 团队通过进行不同的实验来正确理解驾驶者的期望行为。我们测试了人们更喜欢与助手开始互动的方式,并做了一些有趣的观察:如果人们和其他人一起在车里,他们往往会直呼对方的名字--“Hey,凡妮莎,你能递给我一个三明治吗?” “约翰,别再大吵大闹了!”同样,他们通常称呼语音助手的名字,用唤醒词来激活它:“Hey[助手名字],播放音乐。”不过,在某些情况下,从指令中可以清楚地听出,请求是针对语音系统的--例如,“将导航屏幕设置为北上模式。”因此,即使在多人对话的情况下,也不一定需要唤醒词。此外,并不令人惊讶的是,我们发现当驾驶者独自一人在车内时,表达指令的最自然方式是不必先说唤醒词。
为了满足用户对唤醒对话方式的不同偏好,我们推出了Cerence Just Talk。你可以说出指令,有或没有唤醒词,不需要按任何按钮。Cerence Just Talk会识别你所说的话,只有在构成指令或问题时,它才会立即采取行动。否则,它会一直保持安静-就像詹姆斯会做的那样。
Cerence Just Talk由AI技术驱动,它智能地识别驾驶者何时在与AI 助理交谈,并在他们不对话时保持安静。使用Just Talk,驾驶者可以全时免唤醒自然对话。他们不需要按下按钮或说出 “Hey{插入爱车的品牌}”。系统会根据用户说出的话语、用户说话的方式以及关连对话的上下文,知道何时被召唤,从而提供一个更直观的、像真人般的交互体验。
除了Cerence Just Talk在文字内容级别上执行的分析之外,我们还将机器学习应用于统计数据,如语音的语调特征、车辆中的乘客数量等,以确保系统理解情景的上下文,并能够明智地决定何时说话。
虽然不使用唤醒词使交互更自然,但就像按下语音按钮一样,它们在对话中仍然有其存在的理由,这取决于驾驶情况和用户偏好。事实上,我们有很多更自然唤醒系统的方式,通过赛轮思的先进技术,你可以定制你的车载助理,给它起一个你喜欢的名字,如凡妮莎,以获得更高级别的个性化体验。我们甚至可以设置系统,让唤醒词在语音指令的不同位置也能被识别出来,比如,“为我播放一些音乐,凡妮莎。”或“我饿了,凡妮莎,请给我找一家餐厅。”
Cerence Just Talk标志着用户界面进入了崭新的时代。无需按下按钮或唤醒词,你的语音助理也能知道你何时与它说话,从而使交互变得更简单、更人性化,并创造直观、自然、有效率和愉悦的交互体验。
发现更多关于
未来出行体验
相关文章
新闻稿
赛轮思AI与英伟达扩大合作,提升CaLLM系列语言模型的能力
了解更多
新闻稿
赛轮思AI与豪华汽车制造商签署长期战略合作协议,共同打造下一代车载体验
了解更多
新闻稿
Mapbox与赛轮思AI携手合作,加速语音驱动导航的未来发展
了解更多