前言:
今天同学们对“智能音响语音识别算法”可能比较注重,大家都想要学习一些“智能音响语音识别算法”的相关文章。那么小编同时在网上网罗了一些对于“智能音响语音识别算法””的相关知识,希望看官们能喜欢,小伙伴们一起来学习一下吧!从2017年起,经历了三年左右的市场爆发期后,智能音箱赛道安静了下来,其被百度、阿里、小米三巨头所占据的市场格局也已经初步形成。但在家庭场景中,不少音箱因为语音助手还不够“聪明”,回归其作为音箱的属性,甚至成为“落土”的存在。现在,ChatGPT和大模型已经开始影响到这一赛道。昔日的“百箱大战”,还会战火重燃吗?
ChatGPT爆火后,智能音箱们,抢先要步入“GPT+”时代了。
5月10日,国光电器发布了一则公告称,公司研发的搭载ChatGPT智能音箱于本月推出,因未正式对外销售,未实现销售收入。在5月11日,该公司股价涨停,报20.74元/股,刷新了自2016年以来的新高,总市值达到97亿元。当天A股其他智能音箱概念股中,奋达科技也触及涨停,恒玄科技、全志科技、惠威科技、佳禾智能等跟涨。
事实上,互联网巨头们早已在智能音箱与AIGC大模型的结合上进行了试水。今年2月9日,百度旗下智能硬件品牌小度科技宣布,打造针对智能设备场景的AI模型“小度灵机”。小度灵机融合了文心一言的全面能力,将应用到小度全系产品中;借助它,可将现有智能音箱中的语音助手变成“超级助理”。
此外,值得关注的是,日前据媒体报道,小度科技也将进军手机,将于5月下旬发布首款智能手机。百度集团副总裁、小度科技CEO景鲲也在自己的朋友圈确认:“小度手机来了!”他还透露称,小度还有新物种+全新品牌“小度青禾”即将推出。
5月9日,阿里旗下的天猫精灵接入通义千问大模型的首款智能音箱新品-IN糖Pro宣布发售;在满足各项评估条件后,该产品用户可升级基于大模型的AIGC对话体验。之前,天猫精灵在今年4月还悄然上线了阿里版ChatGPT语音助手、脱口秀版GPT“鸟鸟分鸟”。
小度和天猫精灵,已经是国内智能音箱领域的头部玩家。根据市场调研机构洛图科技(RUNTO)发布的报告,2022年,在国内智能音箱市场中,百度以35%的市场份额位居第一;小米以31%的市场份额排在第二;天猫精灵市场份额为27%,排在第三位;华为排名第四,份额为4%。排名前四家厂商的合计市场份额达到97%。
智能音箱在经历了当年的“百箱大战”之后,已经逐渐趋于平静。百度等三大巨头占据了市场前列,也建立了行业的进入壁垒,中小厂商已经出现退出者。前述报告显示,中国智能音箱2022年的销量为2631万台,同比下降了28%;市场销售额为75.3亿元,同比下降25%;在售品牌也从2020年的43个减少到了2022年的27个。
今年3月,叮咚智能音箱发公告宣布在3月底停服。作为国内最早一批智能音箱品牌之一,这位“老大哥”的离场,也引起了业界的一片唏嘘。
智能音箱,能否凭借GPT大模型实现一次新的飞跃?
01、语音助手,能成为真正的“智能助理”吗?
在今年2月和3月,百度公布了小度灵机大模型内测的系列视频。其中,为了测试它“超级助理”的技术实力,工程师们模拟日常真实环境中多人对话发问的场景,提出了一连串复杂冗长的问题。其中包括开公司例会、剪头发、看望妈妈等多种事项,测试的工程师在其中故意多次更改时间、替换事件,还穿插了准备会议材料、找孩子的学生卡、带钥匙、买东西等多种事项,以此来考验超级助理,是否能准确地作出理解,列出一份正确的待办事项时间表,满足用户的提醒需求。
在内测中,作为“智能管家”的身份,小度灵机还调度全屋智能家电,根据用户的需求开关空调、调整温度。比起以往只会执行“打开空调”“关闭空调”的智能语音助手来,它能认识到,根据用户想要的到家时间、不同季度的温度,执行调节空调的任务。
在4月阿里云峰会上展示的天猫精灵对话式智能交互系统,相比之前的产品,能力也有了一定的提升,它支持自由对话,能根据用户需求和场景随时生成内容。比如说,用户可以在跑步时要求天猫精灵合成一个“50%穿插摇滚风格的歌曲”的定制版歌单;用户对不感兴趣的话题可以随时打断,并任意开启下一个话题等等。
广大用户苦于市面上大多“人工智障”智能硬件久矣,这无疑是一个好消息。
因为携带便利,且加载AI语音助手,智能音箱曾经给创投市场提供了巨大的想象空间。但随着市场早期教育的完成,用户对其的新奇感逐渐过去,智能音箱的体验感不足的问题也就浮出水面——不少音箱的语音助手们不仅不“聪明”,甚至在交互上,还有些困难。
尽管智能音箱市场已经扩大,但AI语音识别技术的算法却没有在近几年获得更大的突破,始终缺乏一个真正实现质变的拐点。不少音箱的语音助手,唤醒的等待时间较长;在交互时语音识别容易出现偏差、对于长句理解不够准确,对于多轮对话无法准确理解前后语义。此外,这些语音助手的数据库还不够完善,只能理解有限的问题,在对话时对于很多问题无法提供答案。
像大众所熟悉的苹果Siri、亚马逊的Alexa和谷歌助手基本上都通过所谓的命令和控制系统进行操控,如果用户所提出的问题超出了其代码覆盖范围,语音助手就无能为力了。
既然“交互”仍然存在障碍,不少家庭中的智能音箱,也就逐渐回归了“音箱”的本来属性。
现在,ChatGPT的出现,给语音助手提供了新的优化思路。ChatGPT生成的是文本,但其背后由大语言模型驱动,这些模型系统经过大量网络数据集的训练,能识别和生成基于数据集的文本,在此基础上生成完整的句子。它的自然语言理解能力更强,且具有更强的通用性。
借助GPT大模型升级语音助手也因此具有了可能性。如果机器理解人类语音指令的能力能够实现飞跃,智能音箱也就能够成为用户工作和生活中真正的“助手”。
在全球最大的代码托管平台Github上,就有开发者尝试将ChatGPT接入小爱同学。在B站上,也可以搜索到在无违规基础上实现该操作的视频。当用户完成部署后,唤醒小爱同学进行提问,ChatGPT生成的文本则会被小爱同学通过TTS(语音合成技术)进行语音回答。
在视频中,有开发者表示,这样的智能音箱,实现了“智商飙升”。
02、巨头们会选择下场升级吗?
智能音箱语音助手的升级,会是巨头们下一个选择吗?
事实上,在2017年左右,智能音箱曾经站上风口。除了海外的谷歌、苹果、亚马逊等公司外,国内市场上,包括百度、阿里、小米、华为、京东、科大讯飞、喜马拉雅等巨头都纷纷下场,一时间市场上聚集了几十个品牌,热闹非凡;智能音箱领域甚至掀起了史无前例的价格战,一款音箱卖出了不到百元的“白菜价”。
智能音箱一度担负起了充当语音交互入口、实现万物互联的重任。在AIoT时代,业界期待新的交互方式诞生,当更多的设备可以联网时,语音成为被寄予期望的未来核心交互入口。
亚马逊Echo音箱的成功曾给业界提供了一个现成的样本,证明了这个产品在逻辑上具有可行性。因此,巨头们也纷纷在智能音箱市场会师,大家都生恐在时代转折点来临时缺席。
此外,当智能手机的红利期逐渐消逝,“物联网”成为互联网公司们拓宽业务赛道、布局全场景的一个关键词,智能音箱适合家庭远场交互,也比较容易普及,就被看作是手机之外,充当未来智能生态“入口”的代替品。像小米,在2019年启动“手机+AIoT”双引擎战略时,就将智能音箱作为其全屋智能设备的操控入口之一。
2020年,小度科技宣布独立融资,之后公布了其“一屋一屏”战略,加快了全屋智能的布局,在智能音箱之后,围绕着对话式AI操作系统,不断扩充家庭硬件品类。而由此看来,小度科技的手机,也将是其AI智能硬件生态其中的一环。
在经历了三年左右的狂飙猛进和价格战后,智能音箱的首轮市场普及已经完成。百度、阿里、小米几大巨头更是稳定地把住了国内智能音箱市场的头部位置。
但随着市场渗透率逐渐见顶、用户也已经过了“猎奇”的尝鲜阶段,智能音箱接下来的发展,或许重点还是应该放在高端、品质化和生态牌上。语音助手搭载更具理解能力的大模型,AIoT生态中的智能家居场景也就更具有商业想象力了。但要实现这些,还需要进一步期待,是否有更多的大厂们下场。
但资本市场上已经对其投入了关注。智能音箱概念股近期出现上涨行情,也有机构对行业未来表示看好。方正证券认为,随着ChatGPT、文心一言、通义千问等大语言模型新技术的应用改善产品功能、智能家居行业的发展、经济形势向好发展的态势以及居民消费需求的释放,智能音箱行业市场规模仍有上升空间。申万宏源证券也认为,ChatGPT将助力智能音箱成为AI“嘴替”,点燃智能语音应用生态。
洛图科技也预测,在2023年,中国智能音箱行业销量将达2715万台,恢复增长态势。
(作者 | 杨洁,编辑 | 孙月)
标签: #智能音响语音识别算法