龙空技术网

手机中的Siri是如何读懂你的话的,原来是NPL

大数据驱动的研究 142

前言:

此时咱们对“siri算法”大约比较关怀,我们都想要剖析一些“siri算法”的相关资讯。那么小编同时在网摘上汇集了一些有关“siri算法””的相关内容,希望你们能喜欢,小伙伴们一起来学习一下吧!

走进智能时代的我们,如果想订个闹钟,我们可以直接向我们的手机说,“Hi,Siri,帮我订一个明天早上七点钟的闹钟”。

我们不需要手动设置即可通过Siri帮助我们完成部分的手机业务,那么手机中的Siri是如何听懂我们说的话,又是如何帮助我们做事的?这篇文章将告诉你答案。

一、Siri技术的基石——自然语言处理(NPL)

Siri,全名叫做苹果智能语音助手。它成立于2007年,2010年被苹果以2亿美金收购,最初是以文字聊天服务为主,随后通过与全球最大的语音识别厂商Nuance合作,Siri实现了语音识别功能。语音识别是自然语言处理的重要组成部分。如今自然语言处理作为人工智能技术的重要支撑技术之一,已经广泛地应用于多个领域,比如同声传译、机器翻译、智能回答等。

自然语言处理的定义

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。用通俗的话语来讲,就是让机器能够理解我们人类所表达的话,并进行交流。比如我们日常生活中常见的智能音响,我们通过语言沟通的方式让他帮助我们进行播放歌曲,做事等。

自然语言处理的领域

自然语言处理覆盖了多个领域,其中主要有以下几个重要的方面:

语音识别QCR(文本或图片识别)语型分析语法识别语义识别机器阅读理解(篇章理解)

自然语言处理的应用

机器翻译文本识别转换垃圾邮件过滤自动问答文本情感分析舆情分析智能推荐信息检索

二、Siri的工作原理语音识别

你的手机中的系统里面有个强大的硬件,这个硬件它里面内置了一个语音识别装置系统,它会利用自身的深度神经网络接受与判别用户的声音,并且通过用户的声音来判断是否有说出Hi Siri这个词语,然后启动语音识别系统。

编码转换

在接受到语音之后,机器会把语音转换成机器可以读懂的语言,通常转化成0-1代码,形成一个数据包。这个数据包会同时会被手机端和服务服务器端识别,来判断用户发出的指令属于属于手机端的还是服务端,比如定闹铃、查询日历等是属于手机端的,而询问某个具体的问题则会被服务器端识别,把数据包发送到服务器上面,并请求反映。需要说明的是,在这个过程中数据的吞吐量是传送速度是及其快的,可以达到毫秒级反应。

3.语义内容分析

当数据包发送到服务器端的时候,会有一个庞大的数据分析进行内容分析,这里会涉及到核心的算法与模型,这些算法会利深度网络学习等技术进行内容的归纳、判别、分析,并对这些数据进行评价。

4.做出指令回答

当做出评价之后,数据包会返回到你的手机中,并发出相关的指令,做出相应的回答。

三、结语

关于屏蔽术语与非理解性术语

当提问涉及到一些敏感信息,比如涉黄、涉毒等,它会发出,“我没有听懂你说话的话”等,这也是在进行语义分析时要避免的话题。除此之外,当涉及的问题机器不能够识别的时候,也会出现的话语,这可能是机器在深度学习等技术中还没有学到相应的话语。

关于Siri,大家还有什么看法,欢迎 大家评论交流。

标签: #siri算法