人类技术文明的发展史过程中,始终伴随着感知和肢体的延伸与解放,从结绳记事到视频电话、从老马识途到卫星导航、从烽火狼烟到智能交通等等,人类的肢体及其感知系统在不断拓展自身的影响范围,而在此过程中,信息流向也从简单到复杂、由单向传递变为双向互动。基于Internet互联网技术实现了人的思想联网,进而引发了人类史上空前的信息大爆炸,而作为人类肢体的附属或衍生物,汽车及其联网工程毫无疑问会给人类拓展肢体空间带来更大的变化。在车联网技术的一端,从国内热炒语音导航开始,人们已经意识到在车联网时代,“动嘴”远比“动手”更为快捷。沿着这种用嘴导航的思路,在车载主机领域全面实现声控技术,改革人机对话模式,从技术端提高车联网终端设备的使用效率和用户黏度,逐渐成为推动车联网发展的重要环节。
声控操作的优劣势分析
声控技术对车载主机的贡献率究竟有多高不好断言,如果换句话说,车载主机的接触式操作和非接触式操作哪种更适合车载使用,可能很多从事车载主机行业的人会猛然惊醒。目前绝大多数车载主机都通过按键、旋钮、触摸屏等接触式操作实现功能,这类物理接触和按键、旋钮及触摸屏的物理使用极限有很大关系,如按键、旋钮的阻尼、触摸屏的寿命等等。在通常使用寿命范围内,一台处于正常工作状态的车载主机,每一个功能实现都伴随着很大的误操作风险。在提升功能操控效率方面,以导航厂家为首的企业正在谋求更高效的方式。目前车载主机操控中普遍存在的事实是,当车辆处于行驶状态时,我们要改变导航路径时,就需要手动触摸屏幕设定目的地、路径等等信息,特别是在目的地输入时,系统不能辨识的几率很高。这种情况普遍存在于收音机、DVD、蓝牙等主要车载主机功能中,尽管我们设置了很多快捷方式,如导航路径记忆、收音机存台、蓝牙匹配记录等个性化操作方式,从长远来看,这些快捷方式并不能包打天下,也正因为如此,在车载主机的操作方式上,缺乏革命性的产品。
由于触摸灵敏度问题和菜单之间的距离问题,误操作的烦恼总会烦扰着车主。此外,任何一台车载主机,都有使用寿命,其按键也会随着时间和应用次数的增加而灵敏度降低,一旦遇上按键失灵,得费多番周折才能重新使用。
客观而言,对于车载主机来说,声控技术是一项具有革命性的先进技术,但不可否认的是,声控技术毕竟使用的是非接触式操作方式,其传输方式受传输介质影响,在无线传输时的合成质量不是很好,尚需进一步提高。在实验室测试时效果可能颇为良好,但在背景噪音较大,尤其是车内使用时,识别率不高的问题就出现了,此外,还有其它方面的因素影响着声控功能的发挥。
毫无疑问,使用环境是影响声控功能最直接的原因之一。一般来说,安静环境下,声控识别系统能表现出良好的识别效果,具有较高的识别能力,但到了嘈杂的环境下,声控功能的效果会不断下降,并且伴随着噪音的不断增加,识别率会大大降低,导致不能正确识别。此外,声源的距离也会使识别效果大打折扣。此处所言音源并非指主机,而是指人的嘴巴,所谓声源距离则表示嘴巴与车载主机拾音孔之间的距离。我们首先借鉴一下一些智能手机的语音识别效率。一般情况下,人们在使用手机时,通常都会嘴巴对着话筒进行通话,此时手机和嘴巴之间的距离保持在10厘米以内,声控在这个距离下功能可以发挥出最佳效果,但是随着声源距离的不断增加,语音识别率会明显降低,尤其在操作的环境中,更不能令人满意。由此可见,在车内,车载主机和声源之间的距离一般在60厘米左右,如何解决这个距离带来的音频在传输过程中的能量损耗,从而导致声控设备不能识别是个大问题。
最后一个影响因素归结于声源的属性。所谓声源的属性应该是用户说话的方言、语音、语调以及语速等,不同的属性会对声控功能产生不同的影响。在语言方面,由于车主地域特征比较明显,通常有标准普通话和方言普通话之分,在标准普通话下手机的语音识别率将会有较高的稳定性,而方言普通话语音识别率相对要差得多。当然在语速、语调方面,不同厂商的声控技术在这些方面的影响也是不一样的。
声控技术车载化
从2010年到2011年底,车载主机从硬件和软件方面都发生了巨大变化,市场进一步甩开膀子在差异化的道路上前进,从硬件方面看,车载主机的平台不再是WinCE一统天下,Android等平台开始加入车载主机,并且延续手机领域的迅猛势头;从软件方面看,声控技术加盟车载主机已经在小范围内成为共识,已有多家厂商开始进行量产或预研。
从目前的产品形态来看,完全应用声控技术的车载主机尚未出现,目前的车载主机声控系统只是作为主机的一个功能卖点,这一方面和厂家的“骑墙心态”有关,另一方面车载主机能否完全实现声控化还需要技术和市场双方去验证,不可操之过急。从长远来看,声控技术会是内核、平台一轮硬件升级换代之后的又一个热点。如果从这个角度看,2010年热炒的“一键导航”技术只是声控技术应用于导航功能的一次“初体验”,当然这种“初夜”带给行业的“快感”余波未平。和“一键导航”不同的是,声控技术体现的更多的是“嵌入式”技术与“云计算”的结合,当然,这和“一键导航”所提供的服务在技术上并不冲突。
现在看来,声控技术车载化带来的最大好处还是在于让车主的双手不要离开方向盘的情况下,实现主机的功能操控。也许,这个技术可以给车载主机普遍返修率居高不下带来意想不到的好处,当然,潜在的风险也是非常高的,最大的问题还是识别率。如何解决在噪杂行驶状态下车载主机可能出现识别率不高的情况?根据前装及后装市场上曾出现过过的解决方案,两种办法可能会对解决这个问题有所帮助,一是采取类似广本锋范高配版将蓝牙安装在驾驶位一侧A柱上的解决思路,这样缩短了声源与车载主机拾音孔之间的距离;另一种解决办法是将第一种办法更进一步,每个车载主机直接配备一个无线蓝牙,通过无线蓝牙将手机、车载主机三者结合起来。
从2012年市场热点看,声控技术成为新一轮热点已经不可逆转,市场需要新技术、新概念重拾增长势头。在这种背景下,车载主机行业和相关的产业的整合、融合趋势也开始显现,如基于云计算的各种数据交换服务、Android等开放平台的应用共享等等。如果说之前车载主机还是一个小众行业,其产业链外延较短,那么随着平台、技术以及车联网等多项技术的催化,车载主机越来越表现为一个开放性的产业。回归声控技术本身,其能否成为推动车载主机车联网的关键一环,还存在诸多不确定因素,尽管有很多声控相关产品及项目获得了成功,但更多线下线上的配套服务需要完善。
正是因为接触式操作的这些问题的存在,才让非接触式操作方式的优势凸显出来,目前非接触式操作较为成熟的当属声控技术。由此,我们也能很好理解为何采用非接触式操作会有更大使用优势,车载主机内部的声音识别系统属于硬设备,相对软件和外设(屏幕、按键等)具有更强的耐用性,因此,只要懂中文和发音基本准确,车载主机内部的声音识别系统就能较高的识别车主需求。当然,声控技术应用于车载主机初期,肯定会出现识别率不高等现象,但随着竞争的出现,相应的声音识别技术肯定会有较大的突破,从而提高车载主机声音识别的灵敏度。
声控技术的瓶颈
任何一项技术的出现,虽然相比它所取代的技术可能具有压倒性的优势,但并非该技术就是最优化的选择,对于声控技术而言,这个论断同样成立。从声控技术面世到开始进入车载主机行业,已经走过近20个年头,不可谓快,但总算不慢,起码不晚。
根据市场上了解到的几家车载主机声控功能及其实际表现而言,主要问题集中于使用环境方面,技术本身没有问题。