媒体报道
 

汽车智能领域中国互联网企业的对手不仅是黑莓和谷歌 还有Cerence

 
2020-02-19    Blue Auto Observation   BAO爱车工作室

 

说到车内智能系统,车圈的朋友估计第一时间都会想到斑马、安卓,更硬核的会说出黑莓的QNX、腾讯长安合作的梧桐车联、百度的DuerOS甚至吉利亿咖通的GKUI。但有这样一家公司,它的名字并不为大众熟知,即使是汽车业内人士,也不是所有人都对它知晓。但正是这样一家公司,2019年全球半数以上生产的汽车都搭载了它家的技术,它的名字就是Cerence。

 

1.webp.jpg

 

Cerence是何方神圣?

 

可能Cerence这个名字普通消费者不熟悉,但Nuance的名字专业人士一定不会陌生。Nuance公司(Nuance Communications, Inc. NASDAQ: NUAN) 是全球最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。著名的电脑语音识别软件NaturallySpeaking就出自于Nuance公司。

 

如果说到这里您还是没有概念,那咱们再举一个通俗易懂的例子:你一定知道iPhone 4S带来的一项革命性的人机交互产品——"Siri"。事实上,为"Siri"提供语音数据库支持的正是Nuance(苹果曾用过一段Vlingo平台,后来改平台被Nuance收购)。

 

作为立足全球的语音和语言解决方案提供商,Nuance的另一个产品或许更为出名——T9输入法。一度全球90%以上的手机都采用T9输入法,这个输入法原本是一家名为"Tegic Communications"所开发,后来被Nuance买了下来。这套输入法的最大优势是支持超过70种语言,超过30亿部移动设备内置T9输入法。已成为业内认同的标准输入法,被众多OEM厂商内置,包括诺基亚、索爱、三星、LG、夏普、海尔、华为等等。

 

2.webp.jpg

 

汽车业务作为Nuance在2B业务中的核心业务之一,20年前就已开始。截至目前,包括奔驰、宝马、奥迪、福特、通用、上汽、吉利等企业仍然是其客户,而全球已有约3亿辆汽车都搭载了这家企业的技术。

为了将汽车业务做专做精,在2019年,Nuance宣布将汽车业务板块拆分上市,拆分后的上市公司便是Cerence。Cerence是一个新创的名字,其寓意结合了智慧(intelligence)、体验(experience)、从容(serenity)和掌控(control)。而在拆分后不到三个月的时间内,Cerence就在2020年的CES上交出了第一份答卷。

 

不懂前沿硬件的智能软件开发者不是语音识别好帮手

 

回溯iPhone的发迹史,其最终的成功并不是源于硬件的创新。毕竟在早期的Palm或微软的掌上电脑,也配备了了触控大屏,摄像头,搭载智能系统,但这些并没有让他们生存到现今。真正使iPhone名声大噪并广为普及的,是OTA的成功与appstore的出现。硬件打好基础,软件赋予灵魂;这就意味着,谁能够将软件与硬件的性能充分发挥出来,才有可能促成真正的创新与变革。

 

3.webp.jpg

 

作为语音识别领域的老兵,Nuance在这一领域曾经称霸一方,但随着大数据技术的兴起,苹果谷歌等巨头的参战与挖角,让细分领域的霸主Nuance也曾失意一时。不过,恰是这样的竞争,促使Nuance站在更高的角度,去重新审视语音识别业务和它的未来。语音识别的目的,是在于让人与机器的交互更加简单直接。如果以语音识别技术为切入点,配合大数据解析和人工智能算法,再辅以诸如HUD、摄像头、全息投影等智能硬件,打造出一套融合视觉、听觉、手势在内的整体交互方案或许更具竞争力!因为L3级及以上的自动驾驶汽车内,驾驶员的精力将从驾驶中解放出来,着眼于未来的智能交互整体解决方案才是制胜的关键。

 

4.webp.jpg

 

在CES 2020 上, Cerence 推出了面向汽车制造商的解决方案——Cerence Drive 升级版。它更像一个超级智能的贾维斯(钢铁侠的智能语音助手),能实现诸如车辆控制、导航设定等常规功能,也可以通过凝视车窗外的一个目标,获取车外兴趣点的介绍和相应的服务功能。比如摄像头会通过观察驾驶员的眼神,按照其凝视的方向,与车辆所处的定位信息进行比对,以确定其所凝视的建筑或者风景到底是什么,并根据这个坐标来提供相应的服务;如饭店桌位预定,电影门票购买,抑或是风景的介绍。同时,驾驶者也可以像电影《碟中谍4》里,汤姆克鲁斯一样,使用手势来移动、选择在挡风玻璃上显示的部件,进行导航、音乐播放、查询天气等操作。驾驶者还可以通过抓取、投掷手势并结合凝视的方式,将导航窗口部件移动至乘客面前的挡风玻璃处,这样乘客就可以扮演"副驾驶"的角色。驾驶者也可以使用点击手势暂停和继续播放音乐,或者播放下一首曲目。

 

5.webp.jpg

 

此次Cerence的交互展示不仅仅限于车内,其联合e.GO MOOVE GmbH、e.GO Digital GmbH 以及 Saint-Gobain Sekurit打造的一辆e.GO Mover 自动驾驶电动巴士展示了车外人机交互的创新方案。结合多语言自动语音识别、自然语言理解和响应、语音合成、语音信号增强及 Saint-Gobain Sekurit透明屏幕技术,人们在车外可以把玻璃作为显示屏,与汽车进行交互,这一技术为消费者更安全更高效地与自动驾驶汽车进行沟通提供了新的思路。

 

细看这两套方案中的技术,包含视线跟踪、手势识别、声源定位、声纹定位以及风挡显示屏、侧窗投影等,而应用到的硬件包含车内摄像头、车内玻璃投影、车内触控屏幕等硬件。如果和前文中提到的多家国内企业做比较,笔者认为无论哪一方都在软件层面做出了非常巨大的努力,但是在软件与硬件结合的层面,或许Cerence带来的CES展品更具启迪效应。而只有将软件与硬件的结合做实做透,才是未来能否产生革命的关键。

 

面向中国的大胆布局

 

Cerence 在独立之后,对组织架构进行了大范围调整。根据Cerence 大中华区高级产品总监刘锋的介绍,目前,Cerence 业务主要分为核心汽车技术单元(Core Automotive BU)、成长型业务和前沿技术单元(Growth and Advance Technology BU),以及专业服务单元( Professional Services BU ) 三大版块。其中成长型业务和前沿技术业务由大中华区负责,总部在上海,并在成都和北京设有分公司,在中国总部,能够看到很多曾经在上汽、东风等传统主机厂服务过的技术人员,他们对中国汽车产业有着深刻的理解。所以,中国总部在国内拥有完整的产品、研发、工程、销售和服务能力,且有着较高的自主权,这大大改进了原 Nuance 体制下的复杂行政及业务流程,使中国团队有了更高的执行效率和创新活力。

 

6.webp.jpg

 

在这样的体制优势下, Cerence 在中国的发展可谓快速。例如在本届 CES 上,他们就展出了2019年年底率先在中国发布的Cerence ARK。这是一套专门为中国汽车制造商打造的语音AI交钥匙解决方案。这套方案支持多语言的语音交互基础功能,并适用于所有主流的车载平台和操作系统。

 

7.webp.jpg

 

Cerence ARK最大的亮点是其集成了核心语音助理功能,包括唤醒词、声纹验证、自动语音识别、自然语言理解和文字转语音,并具有开放、灵活和快速部署的优势,是投入成本最低、开发时间最短、系统性能最优的选择。通过这套方案,汽车制造商可以全方位为客户打造个性化的驾乘体验,通过系统自带的人工智能学习能力,帮助驾驶者和乘客轻松的定制音乐、导航、兴趣点、新闻推送等内容访问。

 

8.webp.jpg

 

该解决方案共有三个服务级别--轻量、标准和高级,并附带三个关键组件-- ARK Edge、ARK Client和ARK Cloud。整车企业和供应商可以灵活选择组件和部署选项。由于整体解决方案仅需要小量自定义即可交付,大幅缩短上市周期,能够帮助汽车制造商和供应商实现快速增值,在市场上颇受欢迎。除中国的多家整车集团外,海外车企业也对这个中国团队主导的项目颇感兴趣。近日,LG 就宣布其webOS Auto 车载信息娱乐系统将搭载 Cerence ARK。

 

但这只是这家公司拆分过后不足半年的业绩,随着时间的积累,拆分后的Cerence预计会在中国市场有着更多的表现力。而对于源于互联网公司的汽车智能产业新进者,Cerence无疑是一个强劲的对手。

相关文章

 

移动世界的最新新闻和观点洞察,了解最新资讯。