| 加入桌面 | 手机版 | 无图版
高级搜索 标王直达
排名推广
排名推广
发布信息
发布信息
会员中心
会员中心
 
当前位置: 首页 » 格力 » 四川 » 成都 » 双流 » 正文

高通侯纪磊揭秘语音交互:个性化AI打造数字化的你

放大字体  缩小字体 发布日期:2018-07-19  浏览次数:106
核心提示: 
 

  【环球网智能综合报道 记者 心月】日前,高通高级总监兼AI研究项目负责人侯纪磊博士在个人博客中发表文章,对于语音交互领域进行了揭秘。他认为,人工智能驱动了语音交互的革命,而真正的虚拟助理是在终端里面有一个“数字化的我”。

  侯纪磊在文章中指出,从更精美的照片、更高的安全性到更自然的用户界面(UI),人工智能(AI)正以无缝的方式更多地丰富我们的生活。高能效和个性化是高通人工智能研究院的核心研究领域,因为它们对于下一代无处不在的智能用户体验而言不可或缺。终端侧AI正在支持虚拟助理的发展,而个性化正成为今天的虚拟助理和未来真正个人助理之间的主要差异。

图为高通侯纪磊博士在环球智能世界大会上发表演讲

  

语音交互的功能组件

  为什么今天语音交互变得如此普及?一个重要因素是,机器学习已经点燃了语音交互的革命。机器语音识别的准确率正不断逼近95%,达到与人类准确率相当的水平。当机器准确率不能达到人类的水平,整个语音交互过程就没法做到对话式的自然高效交流,因此用户体验会有显著下降。机器学习技术可应用于几乎所有的语音交互组件之上,从而提升各方面及整体的交互体验。

  

语音交互的主要组件正向终端侧迁移

  高通正积极应对这项挑战,并把低功耗的终端侧AI应用于语音交互组件之上。以下是几个例子:

  语音降噪将带噪语音处理成清晰语音并输出,这在嘈杂环境中尤其重要。高通人工智能研究院正在开发一个降噪深度学习模型,该模型与传统方法相比有显著的性能提升,并具有较高效率可在助听器这样非常受限的处理能力、功耗和散热条件下运行。

  自动语音识别将语音转录为文本。测试表明,深度学习技术可在移动终端上实现顶级的语音识别准确率。高通人工智能研究院已经完成了一个深度学习声学模型的训练并使其适应每个用户的口音和环境,从而提高个性化程度。

  今天,终端侧的语音交互已经成为现实。高通人工智能研究院已经可以在终端侧实现整体的端到端语音交互处理,并在2018年的CES大会上演示了智能家居中的端到端语音交互体验。在适应口音和环境后,这项演示对特定领域的指令集已经可以实现超过95%的意图理解准确率。

  

情境式智能融合多种传感器和个人信息

  增强个性化的一大好处在于,它能够推动个人助理进一步发展并兼具响应性和主动性。真正的个人助理不仅能够在用户提问时提供个性化的答案,还能基于情境分析进行自主决策和无提示对话。

  为进一步提升虚拟助理的个性化程度,高通人工智能研究院正对终端侧的“AI agent”展开研究,它有望从所有传感器数据中不断学习个人信息,最终实现直观行动。AI agent的关键功能包括情境式融合及学习,这最终将支持个性化响应并丰富我们的生活。初步研究结果已展现出终端侧个性化的远大前景。个性化不仅将提升虚拟个人助理的用户体验,而且将丰富我们生活的方方面面。这项技术将变革众多行业,不断推动行业创新。

 
 
[ 格力搜索 ]  [ ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 

 
推荐图文
推荐格力
点击排行
 
 
购物车(0)    站内信(0)     新对话(0)