华为EMUI的小艺长大了——看下图,猜一猜这一次小艺又进化了什么能力?
天啦,语音操作下,你想插嘴打断就打断了?嘈杂环境下,怎么不被噪声干扰?
华为EMUI语音助手长大了,升级EMUI10后的智能语音多了这个功能,可识别主人声音,瞬间让智能语音好用很多。长按电源键1秒唤醒小艺:惊不惊喜,意不意外!这么“skr”的能力,让我们细细说来。
过滤掉噪声,扫除基础障碍
实现插嘴打断的第一步,是让小艺在嘈杂环境下,清楚地识别出人声。声音本质是携带信息的能量波,为了把你的声音从茫茫的噪声海中pick出来,小艺通过音频降噪和语音识别降噪,共同抑制噪声能量、增强人声能量。
如果说在嘈杂的背景声中选出人声属于众里寻他千百度,那旁边有人在大声说话、能量波强度也相似的干扰场景就属于真假美猴王了。对于这个问题,小艺使用华为特有的VAD和ASR识别机制来解决。
普通的VAD技术可以识别出噪声和人声。而华为特有的VAD结合ASR识别机制,可以区分出噪声、无效人声、有效人声。做到噪音和无效人声不识别,当前有效人声才能识别。
消除播报的回音,清扫第二只拦路虎
既然能在嘈杂环境下识别出你的声音,那随时打断小艺,也就是小意思了。但插嘴打断是在播报时候进行的,那就不可避免的会把手机语音播报的内容给收进去。理想的方案是回声消除法:即用原始音消除播报回声的能量。
现实中,因为器件和声音外放的原因,声音的波形会发生变化,实际的回声声波和原始声波不能成线性,说人话就是不能消除。
这就轮到华为独特的AI消噪技术上场了。它引入深度神经网络来训练智能的语音识别声学模型,消除变形的能量。
不是对我说的话,我绝不会误解
过滤掉这两种干扰后,当你在小艺播报过程中打断它时,它都能准确识别出你的声音、理解你的意图,并做出回应。或许你还有一个疑问:小艺播报时我跟旁人的对话,岂不是也会打断小艺?
不会的。小艺引入了强大的意图分类模型,通过把文字识别成意图,可以分辨出你是否在对它讲话,从而避免被干扰。
经历了九九八十一难,你的语音在各种干扰的情况下,经历了语音转换和语义识别,实现了嘈杂环境、人声干扰、播报回声干扰中的识别,最终成功插嘴打断。
成人的世界没有一件事是容易的。
不过再难,小艺也会与你一路同行,共同成长。
这么好用的语音助手黑科技哪里有呢?在装有EMUI10的全新Mate30系列手机上,快快体验一下吧!
欢迎关注 [ 华为手机功能教程] ,人人都做手机达人。
推荐阅读:oppo与vivo什么关系