欢迎光临青岛安防协会网站,您是第 位访问者

解放双手 车载语音导航时代来临

2009-08-11

发布:2009/8/11  阅读:208

题记:中国汽车保有量迅速增加,中国导航设备普及率近年来虽持续快速增加,但相对于汽车总保有量来说,比例依然很低,远低于欧美25%、日本 59%的普及率,发展空间极大。中国地大物博、交通情况复杂的特点也决定了导航设备在中国的应用更具必要性与现实意义,且中国导航产品具有突出的性价比优 势。语音技术与导航设备的结合是大势所趋,既是用户实际需求,又是导航产品的必然发展方向,市场空间极为广阔。那么什么是语音技术?语音技术的发展现状怎 样?它到底是如何与导航产品结合的?它将给未来的汽车带来哪些价值?


  语音导航国际发展趋势


  从全球汽车产业发展状况来看,语音技术在车载导航中的应用是一种新的趋势。传统的车载导航产品,是用眼睛看的方式获取相关信息,对汽车驾驶者而言存在一定的安全隐患。因此,基于广大汽车驾驶者安全性、舒适性考虑,将语音技术应用于导航领域是必然趋势。


  语音技术在车载导航中的应用已成为国际汽车发展的必然趋势,这将真正实现人机语音交互。目前,雷克萨斯采用了来自Voice Box Technologies公司的语音识别(VR)解决方案。奥迪也正在专注于改善其语音识别,并推出了新的升级版软件来更新其MMI,使其变得更加用户友 好。同时,更多整车厂也在为车载导航产品积极寻求适合的语音技术解决方案。


  国际上每年都有举办“Blizzard Challenge”比赛,它是国际英文语音合成研发领域最高级别的赛事,参赛单位包括中国的科大讯飞、美国麻省理工学院(MIT)、卡耐基-梅隆大学 (CMU)、IBM 研究院、微软研究院、英国爱丁堡大学、日本ATR(国际电气通信基础技术研究所)等国际一流的语音研究机构,在一起既同场竞技,又共同交流技术。


  在不远的将来,语音车载导航技术的以及整车语音技术的应用水平,将成为衡量高端车型的一个重要标准。在更长远的时间里,语音技术在汽车上的应用将更为普遍,成为汽车的一项基本配置和功能。


  语音导航国内发展状况


  目前,国内汽车制造厂商就语音技术在车载导航中的应用已经达成了广泛的共识,都在积极寻求语音技术提供商。与此同时,汽车制造厂商在寻求合作伙伴的时候从长远发展角度考虑,重点关注语音技术提供商的综合实力,要求技术供应商具有从语音合成到语音识别的全面技术领先。


  当前,将车载导航设备与语音技术结合,也成为了各厂商普遍关注的增加产品亮点和竞争力的一条重要途径。


  对于车载导航来说,有了语音合成,无论是千变万化的道路名称,还是随时到来的路况信息,都能随时播报;有了语音识别,目的地设定、路况信息查 询,只需说出命令即可完成操作。“合成+识别”的理念和解决方案,真正实现了交互式的语音导航系统,从根本上解决了安全隐患,提升了汽车驾驶乐趣。


  目前国内已推出的具有语音功能的导航产品中绝大部分应用的都是科大讯飞的语音合成技术,实现信息语音播报、语音操作提示等功能,并对于语音识别技术在导航产品中的应用与厂商共同合作进行预研和应用探讨。


  据了解,在国内做语音导航研究的有多家公司,其中科大讯飞在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。语音导航在车载 领域的应用上,当关闭车窗的情况下,只要是普通话或与普通话相近的方言,科大讯飞语音一次性识别正确率都可以达到90%以上。此外,语音识别功能的成本已 经大大降低,加入的硬件和软件授权费都在厂商和用户的接受范围之内,与语音车载导航的高性能、高附加值相比,可以说微不足道。


  语音导航的车载价值


  最大价值表现在:以语音合成、语音识别、语音编解码为方向的智能语音技术应用在车载领域,将改变汽车现有的人机信息交流方式,解放驾驶者的双手和双眼,使汽车具备更人性化魅力,体现个性化特色,提高驾车安全性。


  未来,语音技术将会在车载中得到更大更广泛的应用,通过“变看为听”的车内语音信息服务,“君子动口不动手”的车内语音声控操作,随意调节车内 温度、亮度等,使汽车操作更具人性化、趣味性,使驾驶者真正实现“易车生活”,将为汽车工业的发展带来一场真正的革命。目前,随着中国汽车工业的快速发展 和汽车保有量的增加,汽车消费者对于汽车性能提出了更高的要求,电子化、智能化和网络化趋势已成为当前汽车行业的流行主题,语音技术在汽车领域中的应用空 间十分广阔。


  同时,智能语音技术在车载导航设备上的应用,亦对整个产业链的拓展、发展具有重要意义,提供了新的、广阔的增值空间。


  语音导航如何应用到车载


  语音识别技术的引用对硬件设备及软件系统的支持能力会有更高的要求:


  其一,在硬件配合上,需要更高性能的处理器,区别于一般性能的高品质麦克风和适合录音数据传送的音频电路,以此来保证识别引擎接受数据的完整性和可用性;


  其二,在导航软件上,需要软件开发商在搜索引擎的接口中加入便于语音识别系统可以调用的数据和命令菜单,以此来实现分类信息搜索、POI搜索和交叉路口搜索等功能。


  语音导航应用的难题


  语音技术在车载导航中应用的技术难点可从语音合成、语音识别两方面来看。


  语音合成方面,技术难点即在于语音合成的技术水平与质量。语音识别方面的技术难点主要表现在对众多口音和方言的支持、对车内噪音环境的适应和处理,以及命令中关键词的提取上。


  中国地大物博,方言有几千种,部分方言与普通话差别甚大,基于标准普通话的语音识别系统在识别带有方言口音的普通话时,识别率会下降很多。


  对于中文语音识别应用中经常面临的方言口音、复杂信道和背景噪声等问题,依据从实际业务系统中收集的涵盖不同方言和不同环境噪声的海量语音数据,采用最新的区分性训练方法进行语音建模,从而使语音识别产品在复杂应用环境下可以拥有良好的一致性效果表现。


  “随意说”的难点在于核心命令词的提取、语意分析。该技术使用户可以自如地以自然语言与智能语音信息服务系统进行交互,经过引擎的自然语意分析理解而得到用户的意图,再反馈给用户对应的需求信息,从而引导用户达到其预想的目标。


  另外,在车辆使用过程中,发送机的运转声、空调噪音、窗外环境的噪声和风噪等各类噪音会对车内的语音识别效果形成一定的影响。总而言之,解决应用技术难点的核心在于语音技术供应商在核心技术、语音资源库等方面的长期积累、研究。


  在国内,一直在智能语音技术较为领先的科大讯飞公司,通过多年的研究积累了大量的方言数据库,语音合成技术已经达到不仅能生成标准流畅的普通话,而且可以支持四川话、河南话、湖南话、东北话等几乎全部的主流方言。


  语音导航如何操作?


  两个前提:第一,需要导航软件厂商将车载设备可以支持的命令词内容信息告知用户(这些内容可能是在导航菜单界面的功能名称,也可能是用户自行设 置的目的地名称及手机联系人的名称等);第二,车载设备商可以在方向盘或车载导航仪上安装一个语音识别启动按键,通过按动识别键启动语音控制系统,用户对 着识别麦克说出自己的需求,系统通过识别用户的语言,实现用户的需求。


  在实际使用中,如用户需要导航仪寻找当前所在位置附近的加油站,按动识别键后直接对着麦克风说“导航到附近加油站”,导航仪会将搜索到的附近加油站的位置和具体信息通过图形显示和语音回馈给用户。


  当用户需要查询某一位置时可以说出此POI的名称,如“家乐福超市”,识别系统便会结合搜索引擎按照由近至远的方式为用户列出附近的家乐福超市的位置信息;另外,用户也可以说出希望去往的某个交叉路口的名称,如“深南大道和农林路交叉口”等找到目的地。


  随着智能语音识别技术的不断完善,数据资源的不断积累,用户可以不拘于固定的语言表达方式而用较为自然的语音进行命令输入,如“导航到某某地”这样的命令也可以说成“我想去某某地”、“某某地在哪”或“带我去某某地”等多种表述方式,语音系统都可以正确识别并处理。


  语音导航其它应用


  语音识别技术在车载影音娱乐、通信系统、舒适系统中得到了更广泛的应用,语音技术将进一步增强汽车的安全与舒适性能。


  语音系统可以实现CD、MP3、收音机功能控制,也可以实现语音点歌搜索:用户只要说出歌手或歌曲名称,或者哼唱一段歌词,车载MP3就会搜索 到你想要听的音乐。通信方面,车载设备通过蓝牙与手机连接后,只要对其说出人名或号码,手机就会进行自动拨号。另外,通过声控可以实现车内温度、亮度等调 节,使驾驶者能够真正享受到车内舒适生活。除了语音识别技术,语音合成系统可以实现对汽车油量、电量、胎压以及速度的播报及声控结果的反馈确认等。


  基于汽车的安全性能考虑,对车载的功能进行控制没有复杂的操作程序,只需要通过开口说话就可以解决。另外,针对在车内环境的智能语音应用场景, 也会设计一整套语音交互的流程方案,更加方便用户接受和使用。在语音识别引擎获得用户命令到正确反馈信息的时间是相当短暂的,以毫秒计算,这个过程完全不 会影响到用户的使用。


  未来,语音系统将成为车载内信息获取、互动娱乐、程序操控的重要工具,真正成为车载设备综合控制终端,解放驾驶者的双手,为改善行车安全、提升车载娱乐价值、促进车载信息化发挥举足轻重的作用。

作者:CTI论坛编辑