龙空技术网

深耕人工智能技术,科大讯飞:以史为鉴,AI龙头如何炼成?

远瞻文库 5353

前言:

现在我们对“科大讯飞的人工智能水平在国际上怎么样”大概比较重视,兄弟们都想要了解一些“科大讯飞的人工智能水平在国际上怎么样”的相关文章。那么小编也在网摘上搜集了一些关于“科大讯飞的人工智能水平在国际上怎么样””的相关文章,希望兄弟们能喜欢,朋友们快快来学习一下吧!

(报告出品方/分析师:长江证券 宗建树)

科大讯飞:不断进化的 AI 龙头

科大讯飞是国内人工智能领军企业,其最大的特点是具备不断进化的能力。

公司成立于 1999 年,成立之初主要围绕智能语音技术进行商业化探索;后于 2010 年发布以智能语音和人机交互为核心的人工智能开放平台——讯飞开放平台,将自身 AI 能力向下游移动互联网以及智能硬件开发者输出;

在平台基础上,2015-2018 年公司持续拓展行业赛道,推出覆盖多个行业的智能产品及服务,推动在智慧教育、智慧医疗、智慧城市、智慧司法、金融科技、智能汽车、运营商、消费者等领域的深度应用,最终升级为 G-B-C 三轮驱动的商业模式;

2019 年公司进入 AI2.0 时代,一方面聚焦智慧办公、个性化学习、智慧政法等核心赛道,进行规模化扩张,推动业务逐渐由项目化向产品化以及运营化转型;

另一方面推行增量绩效与 IPD 改革,提高人员产出及经营效率;2023 年公司推出讯飞星火大模型,再度赋能升级原有业务,同时为公司长期成长再添新动力。

纵观发展历程,公司产品结构及商业模式不断进阶,从技术到行业解决方案再到产品+行业解决方案。

公司坚持“平台+赛道”战略,深耕优质场景。AI 是引导生产力变革的技术,需求端潜在市场空间巨大。

现阶段供给端受限于单一技术难以解决复杂的需求,必须将行业知识与技术相结合,提供整体解决方案,方能大规模落地。

为此公司提出“平台+赛道”的战略,自 2010 年起推出人工智能开放平台,将自身 AI 能力向下游移动互联网以及智能硬件开发者输出。

开放平台一方面汇聚海量数据训练算法,确保公司技术领先性;另一方面聚集大量开发者,打造生态构建护城河。

赛道方面目前公司已经打造 3 大 BG(教育、智慧城市、消费者)+3 大 BU(运营商、汽车、智能服务)+医疗的组织架构,深入教育、医疗、司法、会议等应用场景,提供整体解决方案抢占入口,打造 “算法-数据”闭环持续迭代。在此过程中,公司产品结构不断进阶。

智慧教育与开放平台及消费者业务占据公司 60%左右份额,贡献大部分营收及利润。

公司产品结构较为丰富,规模排序为智慧教育>开放平台及消费者业务>智慧城市>运营商>智慧汽车>智慧医疗>智慧金融。

公司客户分为 G、B、C 三类,其中 G 端主要包括智慧教育中的区域因材施教、智慧城市、智慧医疗;B 端包括智慧教育中以学校建设为主体的因材施教、智课、英语听说、智慧体育等、运营商、智慧汽车、智慧金融;C 端包括智慧教育中的个性化学习册、学习机、E 听说等、开放平台、智能硬件等。

公司成长可以分为四大阶段:

(1)1999-2009 年技术萌芽期,依托智能语音实现商业化变现成为智能语音提供商;

(2)2010-2014 年技术突破期,从感知到认知,提升技术可使用的泛用性;

(3)2015-2018 年 AI 1.0 应用探索期,探索多下游方向,找到可大规模变现的优质赛道;

(4)2019 年至今 AI 2.0 红利显现期,公司布局场景红利逐渐兑现,疫情扰动对成长节奏造成一定影响,大模型的布局再添成长新动力。

本文通过复盘深究公司自成立以来的成长本质,探究新阶段的竞争优势及投资机遇。

技术萌芽期:依托智能语音实现商业化变现

技术萌芽期公司实现了从实验室到商业应用的跨越,奠定了发展的基础。

在技术萌芽期 公司实现了:

(1)技术上:公司联合国内核心高校语音合成、识别为代表的智能语音技术的突破,打破海外厂商垄断,完成复杂语音合成、语音识别引擎研发;

(2)商业上:公司采用“iFLY- inside”模式,即把技术嵌入合作方的系统平台,定位技术提供方,实现在电信、教育等行业的卡位。

(3)产品上:围绕语音合成、语音识别、口语评测,持续推出新产品,产品从细碎走向平台化。2006 年公司正式推出普通话口语评测产品以及开发教学软件,成为切入教育领域的基础。

科大讯飞成立于 1999 年,创始人团队主要来自于中科大电子工程系人机语音通信实验 室。1998 年,核心创始人刘庆峰先生在国家“863 计划”语音合成比赛中,牵头中科大团队拿到第一名,使我国语音合成技术首次达到 3 分(即可用状态),随后计划将此项技术进行产业化落地。

公司围绕智能语音技术先行探索,该技术主要包括语音合成、语音识别、语音评测、声纹识别等。公司早期核心产品分为语音支撑软件、行业应用产品/系统和信息工程与运维服务。

1999-2009 年公司技术萌芽期可分为三个阶段:

(1)1999-2004 年方向摸索及技术投入期:确定 ToB 的商业模式,强技术投入为多产品落地打下基础;

(2)2005-2007 年高速成长期:三年营业收入/归母净利润复合增速分别为 58.5%/130.2%,多产品应用快速铺开;

(3)2008-2009 年,语音技术最强龙头正式上市,新技术投入迎接更多增长点:启动复杂语音合成、语音识别引擎研发,为后续技术突破及成长曲线不断新增打下牢固基础。

2009 年,公司实现营业收入 3.07 亿元,同比增长 19.25%,实现归母净利润 0.80 亿元,同比增长 14.88%。

分业务来看,语音支撑软件和行业应用产品/系统贡献主要利润。

从细分产品上看,公司成长多点开花,为公司成长构建源动力及最强韧性。

2009 年语音支撑软件业务克服了金融危机带来的不利影响保持稳定增长,在电信、金融、导航、学习机、手机等主流应用领域的应用不断深入;电信级语音识别产品通过华为、AVAYA 的测试,为下一步加快推广奠定了基础。公司在语音支撑软件市场的绝对领先地位持续保持且优势明显。

另一方面,公司语音搜索电信增值业务和普通话口语评测及教学业务均取得了快速增长。语 音搜索电信增值业务已经推广应用到全国 28 个联通省级运营点、9 个移动省级运营点以及 10 个电信省级运营点,2009 年该业务全年销售收入比去年同比增长近 80%。

普通话口语评测产品市场推广进展顺利,实现了销售收入翻番增长,并为全国更多省份的全面推广,以及为模拟测试的全面跟进奠定了扎实的基础。

此外,面向中小学英语和普通话教学推出的“畅言有声教具系统”业务进展情况良好,销售收入同比增长 48%。

纵观科大讯飞 1999-2009 年十年发展,可以称为技术+产品+模式蓄力时期,技术优势铸造公司最强先发优势,但是真正使公司创收盈利,与技术投入适配,离不开公司所做到三件事,使其在 2010-至今可以成为一个不断进化的 AI 龙头,形成多成长曲线。

三件事包括(1)技术持续进化,不留短板;(2)产品持续进化,市场卡位;(3)商业模式持续进化,找到合适定位。

技术持续进化,打破垄断,不留短板

技术底蕴浓厚,从实验室出发积淀我国语音技术顶级实力。创始人团队主要来自于中科大电子工程系人机语音通信实验室。

1998 年,核心创始人刘庆峰先生在国家“863 计划”语音合成比赛中,牵头中科大团队拿到第一名,使我国语音合成技术首次达到 3 分(即可用状态),随后计划将此项技术进行产业化落地。随后刘庆峰先生与其导师及同学共同创立“硅谷天音”,即科大讯飞的前身。创立初期以刘庆峰为代表的核心人员形成了公司强大的技术壁垒和先发优势。

与核心院校及实验室合作深度整合中文语音产业核心源头技术,形成打破垄断强实力。

2000 年以前,中国中文语音合成技术市场的主要生产厂商主要包括两类:一类是传统 IT 巨头,包括微软、IBM、Intel、Motorola 等;另一类是专门语音技术厂商。

基于巨大产业化前景,语音技术一直是国际性 IT 巨头的竞争热点,中文语音市场基本由国外企业垄断,但由于这些跨国公司基本把中文语音市场作为其主流市场的一种补充,对中文语音产品的应用开发和市场推广投入力度有限。

公司成立后通过与中国科学技术大学、清华大学、中国社科院语言所等单位深度合作,实现了对中文语音产业核心源头技术的资源整合,实现在中文语音合成等关键技术上处于国际领先水平,扭转了中文语音产业由国外公司控制的竞争格局,成为中国中文语音合成市场的最大供应商。

以语音合成技术为起点纵向横向延伸进化,不留技术短板。

语音合成技术和语音识别技术是智能语音技术的两大核心。语音合成技术是公司的基石技术,技术进展持续代表国家语音合成技术的不断突破,从中文突破至英文等多种语言、音色,再到语音合成引擎研发,为国际领先水平。

以此为起点,公司向语音识别技术进阶,从合作走向自主。2003 年率先与国际领先厂商 Nuance 合作向电信级开发伙伴提供“合成+识别”整体解决方案,以技术优势和先发实力抢占市场,2006 年市场占有率约为 50%+,随后公司始终坚持自主研发,于 2007 年推出了具有自主知识产权的语音识别产品,进一步提升技术实力。

于此同时,口语评测技术发展强劲,2006 年,国家语委在教育部组织正式鉴定该技术为我国推广普通话历史上重大技术突破,率先在上海和安徽进行试点,后在全国得到不断推广。

商业模式持续进化,从 C 端到 B 端,一跃而起

从面向大众消费转向主攻企业,找准模式迎来曙光。

公司成立之初,刘庆峰董事长认为语音技术终极目标时面向大众,融入人们的日常生活,所以首先推出了“畅言 2000”,但是由于当时盗版猖獗,用户付费意识差;团队以技术人员构成,缺乏渠道推广经验;用户电脑使用属于教育期,长因电脑硬件问题也呼叫售后,提升产品成本三大原因使得产品销售并不顺利,持续亏损,公司迎来第一次危机。

后来公司核心创始人于安徽巢湖召开“半汤会议”重新定位,转攻企业级用户,选择像英特尔一样打造“iFLY- inside”模式,即把技术嵌入合作方的系统平台,借大企业实力及背书打入更大市场。2004 年,公司实现扭亏为盈,技术及市场取得双重突破。

借力“iFLY- inside”茁壮成长,实现第一阶段价值提升。

“iFLY-inside”类似于“Intel-inside”,是 2B 模式的一种,即公司并不直接面向终端应用市场,而是基于其掌握的核心技术,向开发商提供语音支持软件服务。

公司与华为的成功案例帮助科大讯飞迅速推动上述商业模式落地:其一,面向华为、中兴、东软等行业应用系统开发商,提供电信级语音软件;其二,面向联想、方正、日立等数码终端产品开发商,提供嵌入式语音软件。但此模式存在成长天花板,产业链话语权有限造成利润空间受限,无法得到用户反馈及数据迭代受限。因此公司逐渐壮大后,选择切入行业,带来了第二阶段价值提升。

强大后模式进阶,打入集中度、垄断性较高行业形成优势卡位。

2004 年公司扭亏为盈后,产品能力、市场能力、团队成熟度均得到大幅成长,公司开始尝试直接向行业终端用户开发应用系统。

公司选择十分明确,瞄准的均为集中度、垄断性较高的行业,包括在教育行业承接国家语委“计算机口语测评”需求,推出普通话、英语口语测评产品;向中国联通、中国移动等电信运营商提供语音搜索增值业务,代表产品为基于语音搜索的电话彩铃/炫铃系统;向政府、电信、公安、烟草等行业客户销售具有语音特色的信息服务与管理系统。

该模式下,公司在上述行业应用领域的起步,往往得益于其在一个由政府机构或企事业单位主导的行业取得了先发优势,从而积累了基础数据资源和行业成功案例,并且由于其高集中性可以快速实现复刻推广。至此,公司开始迎来第二阶段新模式下的价值提升。

商业模式逐渐成熟,多模式保证公司强盈利能力。

公司所销售的语音技术产品,根据技术特点和商用环境不同而采用了不同的商业模式。

其中:电信级语音平台和嵌入式语音软件采用授权许可的模式;一般行业应用软件采用软件系统销售的模式;行业应用软件中的语音增值业务则采用合作运营收入分成的模式。

不同商务模式的有机组合形成了长、短期互补的收益来源,增强了公司的抗风险能力和收入的可持续性。

产品持续进化,先发拓展及卡位多蓝海市场

公司商业模式定位的成功决定了公司成长天花板,但是其市场开拓的确定性来源于公司技术及产品不断进化的能力。围绕语音合成、语音识别、口语评测,公司持续推出新产品。

语音合成方面,公司产品由细碎转向平台化,由单一语种转向多语种多音色,下游行业从一开始的电信级产品逐步走向增值、娱乐等多领域;语音识别方面,从和 Nuance 合作走向自主研发,结合语音合成技术提供语音输入、语音搜索,及基于语音搜索的声动彩铃/炫铃系统等产品服务,进一步拓展产品范围。

口语评测方面,2006 年公司正式 推出普通话口语评测产品以及开发教学软件,成为切入教育领域的基础。

高速成长期:从感知到认知,乘 AI 深度学习技术浪潮快速扩张

2010 年之后随着深度学习技术成熟,AI 行业迎来新一轮供给革命,公司凭借过往智能语音技术的卡位,以及灵敏的技术嗅觉,All in 深度学习技术,实现从感知到认知的全面跃迁,并在商业上实现大规模 AI 应用落地二次腾飞,在这个阶段,公司实现了:

(1)技术上:公司实现感知到认知的跨越,打造讯飞开放平台实现全栈 AI 能力的构建;

(2)商业上:公司打造平台+赛道战略,从过往技术提供上逐渐向垂直 AI 行业应用商切换,通过不断的管理革新,业务和组织架构持续升级,构建起综合解决方案、硬件、平台、软件服务等综合产品提供能力,商业模式上进一步提升;

(3)行业上:公司实现在教育、医疗、消费者、汽车等核心赛道的卡位,大幅打开自身天花板,但由于技术和场景限制,复用性较低;在深度学习为代表的领域模型时代,公司实现了营收体量、商业落地能力(技术赋能>场景定义)、技术能力(感知>认知)的全面升级,在教育等多赛道实现数据源与产业卡位,整体综合竞争力迎来了全面的升级。

但由于技术本身的限制,领域模型时代 AI 跨场景的复制性较差,需要基于每个场景做定制化模型,导致供给成本较高。

公司未能构建起优质的商业模式,利润端未能跟随营收同比例跃升。

在整个高速成长期,按推进节奏又可以细分三个阶段:

(1)2010-2014 年技术突破期:从感知智能走向认知智能;

(2)2015-2018 年 AI 1.0 应用探索期:探索多下游方向,找到可大规模变现的优质赛道;

(3)2019-2022 年 AI 2.0 红利显现兑现期:布局赛道确定 根据地业务,核心业务释放业绩。

2010-2014 年:技术突破,从感知到认知

2010-2014 年是科大讯飞的技术突破起点,是公司借助深度学习技术浪潮崛起的元年。

在此阶段,公司紧抓深度学习新技术周期实现营收、业务、技术上的飞跃。

在技术上:通过讯飞超脑计划公司实现从感知到认知的跨越,构建全栈 AI 技术能力,从过往技术提供商转变为技术赋能商;

在业务上:公司实现教育、消费者、医疗、智慧城市等多个赛道的卡位与布局,逐渐从技术提供商向平台+AI 垂直行业应用厂商切换;

商业模式上:公司从单纯的技术提供为主,向综合解决方案、硬件、平台、软件服务等拓展,大大增强自身 AI 综合落地能力。

技术维度:乘深度学习技术东风,实现感知到认知突破

深度神经网络突破,是智能语音技术达到落地可用的供给拐点。

2010 年,人类尝试复制人脑聆听和处理人类语音的方式,DNN(深度神经网络)在语音识别方面的应用具有革命性的突破。科大讯飞开展 DNN 语音识别研究,并于 2011 年上线中文识别 DNN 系统。

对于新技术的积极接受和大力投入,往往是科大讯飞持续进化的核心源泉。

从感知到认知构建全栈 AI 能力,壁垒日益深厚。

公司管理层以语音技术起家,对 AI 技术变化有着强大的技术预见性,紧抓深度学习的技术风口,快速布局。

2010 年,伴随 DNN(深度神经网络)在语音识别方面的应用产生了革命性的突破,公司开始进行 DNN 语音识别研究;2011 年,公司上线了中文语音识别 DNN 系统;2012 年公司在全球语音合成大赛中的汉语语音合成超过普通人水平;2013 年,公司在语种识别领域精心研发出 BN-ivec 技术;2014 年公司正式启动“讯飞超脑计划”,研发基于类人神经网络的认知智能系统。

得益于公司管理层技术背景出身,面对技术风口敢于 All in,研发费用从 2010 年 0.91 亿提升至 2022 年 31.11 亿,增长约 34 倍。

经过持续研发投入后,终于实现从感知到认知的跨越,并在国际上屡获大奖,构建起全栈 AI 提供能力。

乘时代之东风,供给驱动需求二次扩张。

基于技术突破的浪潮,2010 年至 2014 年,公司开始布局认知人工智能技术。布局人工智能技术主要原因有两点:1)智能语音业务市占率触及行业边界,公司营收增长触及瓶颈;2)人工智能出现技术突破,发展前景广阔。

相比感知人工感知智能时代单纯语音翻译,认知智能时代公司 AI 技术已经可以在部分场景中实现对原有流程的重塑与升级,初步具备场景定义能力,AI 供给能力全面提升,驱动业务重归高速增长。

商业模式:前瞻布局开放平台,“平台+赛道”商业模式雏形初现

公司因其优秀的技术预见性,为了占据人工智能技术的先机,在 2010 年就布局了讯飞开放平台。讯飞开放平台为后来的“平台+赛道“商业模式打下了技术基础。

近十多年来,讯飞开放平台持续为面向移动互联网的广大创业者和海量用户提供智能语音及人工智能开发与服务能力。讯飞开放平台在多语种语音合成、多语种语音识别、自然语言处 理、图文识别、人机交互等领域提供丰富的 AI 能力,帮助开发者降低开发周期和成本,促进高效的产品集成落地。

截至 2023 年 H1,讯飞开放平台已经对外开放 587 项 AI 能力及方案,汇聚开发者团队 497.4 万,总应用数达到 172.5 万。基于讯飞开放平台的 AI 营销业务,也助力开发者伙伴提升商业变现价值。

行业维度:切入教育 AI 赛道,从技术赋能到场景定义

AI 技术突破打开供给,公司深耕教育场景形成环节闭环。2010 年深度神经网络的突破进一步打开了场景的应用范围。

公司 2010 年以前通过口语评测及辅助教学与普通话评测切入教育的细分赛道。2013 年公司收购启明科技,进一步扩大公司在教育行业影响力,扩充中、高考评卷,标准化考场建设业务。后又增加了课堂教学软件、教育云平台、评价系统等多产品,搭建起面向学校、教师、学生和家长多级用户的涵盖教、考、评、学、管全业务的完整产品体系。

因材施教是教育的核心,AI 在教育行业拥有巨大的潜在应用价值。

因材施教是教育的终极理想,但是由于对供给能力要求过高,导致很难普世实现,旺盛的需求叠加强大的付费能力,使得教育场景非常适配 AI 落地,潜在价值巨大。根据罗兰贝格的报告预测,AI 在教育行业落地分为教育辅助、价值创造、因材施教三个阶段。

教学辅助阶段(阶段一):以基础数据收集与呈现点状式、零散的教学辅助类应用为代表的教学辅助阶段;

价值创造阶段(阶段二):实现系统化、智能化教学评价与分析,从而提升学生学习与教师教学效率的价值创造阶段;

因材施教阶段(阶段三):具备认知与强交互能力,以自适应学习为代表的因材施教阶段。

把握时代东风,营收开始起量。伴随着信息技术的发展,我国把教育信息化分为三个主要阶段:教育信息化建设萌芽期(1978-2009 年),教育信息化 1.0 时期(2010-2017 年)以及教育信息化 2.0 新时期(2018 年至今)。

2010 年开始,教育信息化正式进入到 1.0阶段(2010-2017)。

1.0 时期,教育信息化在教育改革发展全局中的战略地位和作用基本确立,各项重点工作取得明显进展,教育信息化逐渐实现从建设转向深度融合。

教育信息化 1.0 致力于发展并提高教育信息化基础设施水平,专注在硬件设备和软件资源等 方面进行布局,战略规划研制逐渐进入常态化,各省市、区县和学校研制了教育信息化发展规划,涌现出智慧教育、智慧校园、未来学校等发展规划。

乘教育信息化的东风,扩学校端客户群体。

公司借助自己在教育考试业务的长年积累以及良好的资源禀赋,快速切入教育信息化领域。

2010 年“智能语音教具系统”实现山西、内蒙古等地规模采购并在十多个省市成功试点;2011 年公司的“畅言班班通”产品,为后期的持续推广打下良好基础;2012 年公司的“国家普通话水平智能测试系统” 29 个省市,累计测试考生突破 800 万人,中高考英语智能听说测试取得重大进展,“高考英语听说考试智能评测系统”在广东通过鉴定,是业界唯一正式应用于中高考英语听说考试的智能评测系统。

2014 年公司的教育云平台、课堂教学软件、评价系统等产品加速在全国推广。智慧教育业务的开辟,为公司营收增速的突破提供了主要动力,公司逐渐由技术及软件服务开始向垂直场景渗透。

2015-2018 年:广撒网,多敛鱼

多赛道投入,应用变现探索

2015 年公司的人工智能底层研发已经初见成效,智慧教育赛道已有初步成就,公司希望把智慧教育赛道的成功案例复制到其他赛道。但此时的公司对人工智能与现实市场结合方案的理解还不够深刻,需要探索人工智能技术的应用场景。

为此,公司在 2015 年提出人工智能 AI1.0 战略,做出“面对人工智能关键机遇窗口期,不追求当前的税后利润增长,把资金坚定的投入到决定未来的战略方向”的前瞻决策,积极探索应用落地场景与技术变现。

在此期间,公司覆盖的赛道数量得到了进一步增长,在云平台服务、移动互联、智能客服、车载助手、互动娱乐、智能硬件、语音信息安全等领域均实现了较大突破。

如在移 动互联赛道形成以讯飞输入法、灵犀为基础、具备自我造血能力的产品体系,打造移动 互联网流量分发入口;在智能客服赛道扩展了语音导航、语音分析产品,建设多渠道、 多模式、人机融合的智能客服系统,提升智能客服领域的产出效益;在车载赛道利用讯飞语音云平台进一步形成针对后装产品及方案的覆盖;在语音信息安全赛道培育人脸识别、声纹识别等前瞻技术在金融、智慧城市等赛道的应用,拓展智能语音技术在公共安全、国防等领域的应用。

公司的不追求税后利润增长,把资金坚定的投入到决定未来的战略方向的决策给公司带来了一定的经营压力。在 2015-2018 年之间,公司的毛利率分别为 48.90%、50.52%、51.38%、50.03%,相比于 2010-2014 年间的 56.88%、57.24%、53.74%、53.01%、55.63%略有下滑。

此外,公司的人均创收与人均创利水平也有一定程度的下滑,人均创收从 2015 年的人均 83.86 万元下降到 2016 年的 55.90 万元;人均创利从 2015 年的 人均14.26 万元下降到 2016 年的 8.16 万元。

技术层面:讯飞超脑计划为底层技术背书

公司在 2014 年为了攻关高级人工智能与认知智能,启动了“讯飞超脑”项目。讯飞超脑计划的目标是攻克人工智能底层技术,产生系统性创新,研发实现具有深层语言理解、全面知识表示、逻辑推理联想、自主学习进化等高级人工智能的智能系统,并将在教育、客服、人机交互、医疗等领域实现推广应用。讯飞超脑计划,是公司从"让计算机能听会说"成功的基础上,向"让计算机能理解会思考"的目标迈进的关键项目支撑。

讯飞超脑可以在感知智能、认知智能以及感知智能与认知智能的深度结合三个领域为技术背书。

感知智能领域主要包括语音合成与语音识别技术,可用于人与人之间自由交谈、会议演讲等场景进行语音实时转写。

认知智能领域主要包括常识推理、知识图谱和阅读理解技术,这些技术有效的支持了教育纸笔阅卷、医疗认知诊断、公安意图识别、法院辅助量刑等领域的认知智能技术研发。

感知智能+认知智能领域主要包含语音交互、智能评测与口语翻译技术,此领域重视人与人工智能的交互,已经成功在智能硬件、智慧教育、旅游、演讲等领域实现广泛的前瞻引领和规模化应用落地。

讯飞超脑的各项成果为公司各个业务方向打开了全新的市场空间,促进建立了公司的人工智能产业生态系统,为公司在智能语音及人工智能领域实现技术突破、聚拢优势资源奠定了坚实的基础。通过讯飞超脑计划,公司实现了人工智能从个体应用到生态系统的融会贯通,使得各业务之间的技术可以大比例复用,为后续各个赛道维度的公司业务扩张打下了良好的基础。

行业维度:以开放平台为基,赛道迅速扩张

智慧医疗前程远大,开辟智慧医疗新理念

公司在 AI1.0 阶段聚焦人工智能在医疗赛道的应用变现。

2016 年,公司面向医疗行业积极布局智能语音、医学影像、基于认知计算的辅助诊疗系统三大领域,讯飞智能语音系统在 301 医院、瑞金医院、北京大学口腔医院、安徽省立医院等 20 多家医院落地使用,并依靠讯飞 AI 技术与外部丰富的医学数据资源,推进在医学影像、辅助诊疗领域的突破。

2017 年,公司的讯飞晓医助理机器人参加了全国执业医师资格考试并以 456 分的优异成绩通过,成为全球首个通过执业医师资格考试的机器人,为医疗认知技术和业务的开展提供了核心技术储备。

截至 2023 年 7 月 31 日,公司已覆盖 1600 种疾病种 类,3 万家医疗机构,提供 6.6 亿次 AI 辅诊,结合 AI 提醒修正 127.39 万份诊断病历。

智慧城市大有作为,多维度价值协同转化

2015 年起,公司开始重点投入智慧城市赛道。

2015 年,公司基于大数据技术开发的智慧城市社管云平台在安徽省内全面推广,成为全国市场标杆,并在江西、广西、吉林等省外市场取得突破;

2016 年,公司的社会服务管理信息化平台覆盖了 8 省 20 余地市,其中安徽省合肥市、芜湖市、阜阳市,吉林省长春市,江西省新余市,内蒙古乌海市,浙江省杭州市均为信息惠民试点城市;

2017 年,公司开始构建“城市超脑”;

2019 年,公司的智慧警务、智慧法院、智慧检务相关产品在全国范围持续落地应用,实现公、检、法、司、安、纪等方向业务全覆盖;

2020 年公司开发上线国内首家 7×24 小时政务服务地图,推行既有空间位置又有服务事项、既能查询又能办事的 7×24 小时不打烊“随时办”服务;

2021 年公司承建了安徽省江淮大数据中心总平台,接入了 16 个地市,交换了 1 万亿条数据,共享调用国家部委接口数据在全国排名前三。

2019 至今:应用规模化输出,变现择优而从之

修枝剪叶,释放规模化红利

正如前文所述,在 2015-2018 年,公司在人工智能上做出了较大投入。

经过四年的应用探索,公司瞄准变现价值,聚焦智慧教育、智慧城市、智慧医疗和消费者业务作为四大核心赛道,并预判智慧汽车、智慧金融等作为潜力赛道。

至此,公司的广撒网捕大鱼的业务模式进入收获期,公司选择砍去其他暂时不能变现的业务,聚焦核心业务的发展,释放规模化红利。修枝剪叶,公司研发的营收占比下滑。

2019-2021 年,公司进入规模化研发时期,投入 从 21.43 亿元上升到 29.36 亿元,但研发投入的营收占比却从 22.39%下降到 16.03%,相比于 2015-2018 年高投入时期的 23.08%、21.36%、21.04%、22.39%下降幅度较快。

行业维度:把握人工智能技术共性,规模化复用打法

正如前文所述,公司首先将人工智能技术投入教育赛道,看中的是教育赛道的高收益、低风险特质。

在人工智能尚无技术突破的早期,教育考试的技术门槛较低,所以公司选择首先切入该业务。

普通话教育考试无需理解考生的答案,计算机只需判定录入答案的匹配度便可给出分数,且答案具有唯一性,极大降低了系统的复杂度。

教育考试的这种特点使得公司选择此路径切入存在一定的历史必然性。

在教育赛道取得成绩之后,公司又把目光投向智慧医疗、智慧城市、消费者业务等领域,希望把人工智能技术规模化复制到其他赛道。

公司依靠讯飞超脑技术,为感知智能、认知智能以及感知智能与认知智能的深度结合三个领域技术背书;而感知智能、认知智能以及感知智能与认知智能的深度结合三个领域又可以作为大多数赛道的技术基础,所以公司的人工智能技术可以在许多赛道规模化推广,颠覆行业的传统经营模式。

商业模式:项目制向产品化过渡,G-B-C 商业模式逐渐升级

初期商业模式以定制化项目为主,后开始向可复用产品转型。

公司初期产品主要包括语音支撑软件和语音应用软件两类,这两种业务都需要公司根据不同的项目用途定制语音产品,技术复用效率较低,难以模块化推广。

后续随着业务升级转型,公司推出了讯飞开发平台、学习机、辅助诊疗系统等产品。新增产品定制化程度低,模块化可复用性强,公司可以把更多的资源聚焦在打磨单个产品上。

自此,公司开始向平台型/产品型公司升级。

以消费者业务为例,2019 年公司推出首款人工智能学习辅助产品-讯飞学习机 X1 Pro。这款学习机是公司长期深耕教育领域的收获。

公司在 2010-2019 年之间深入布局了教育系统,从教育考试入手到智慧课堂与智能作业本,在智慧教育领域积累了大量的业务资源与数据资源,学习机是补全公司智慧教育生态的最后一块拼图,但同时也是 AI 大模型与公司产品相结合的起点。

G-B-C 逐步发展,商业联动模式跑通。

公司在成立之初即拥有中科大的官方背景,通过渠道优势降低了各赛道的准入门槛。

公司成立早期阶段,依靠自身资源禀赋带来的订单立足,后来逐渐将业务推广到国有企业、学校、医院等 B 端单位;等到相关领域业务成熟,积累到了足量的业务资源与数据资源,公司就将业务向 C 端拓展。

G-B-C 联动给公司带来了渠道数据闭环与品牌放大效应。

以教育赛道为例:G 端业务主要以市县区等区域建设为主体,涵盖面向区域内各类学校及用户的因材施教整体解决方案等;B 端业务主要以学校建设为主体,包括面向学校的智慧课堂、大数据精准教学、英语听说课堂、智慧作业等;C 端业务主要以家长用户群自主购买为主,包括 AI 学习机、个性化学习手册、课后服务课程服务等产品。

商业模式:从大量试错到行业聚焦,转型行业 AI

公司在技术变现实现人工智能规模化发展的商业落地过程从早期多业务领域尝试,不同行业试错,到逐步从 2017 年明确“平台+赛道”的人工智能战略(“平台+赛道”的产业发展战略:“平台”,即为全行业提供人工智能能力,整合后台内容和服务,构建持续闭环迭代的生态体系;“赛道”,即人工智能核心技术+应用数据+领域支持,构建垂直入口或行业的刚需+代差优势),在开放平台及消费者业务之外,也逐步将优势行业规模化发展。

“平台+赛道”战略,深耕优质场景。

AI 是引导生产力变革的技术,需求端潜在市场空间巨大。现阶段供给端受限于单一技术难以解决复杂的需求,必须将行业知识与技术相结合,提供整体解决方案,方能大规模落地。

为此公司提出“平台+赛道”的战略,自 2010 年起推出人工智能开放平台,将自身 AI 能力向下游移动互联网以及智能硬件开发者输出。

开放平台一方面汇聚海量数据训练算法,确保公司技术领先性;另一方面聚集大量开发者,打造生态构建护城河。

赛道方面目前公司已经打造 3 大 BG(教育、智慧城市、消费者)+3 大 BU(运营商、汽车、智能服务)+医疗的组织架构,深入教育、医疗、司法、会议等应用场景,提供整体解决方案抢占入口,打造“算法-数据”闭环持续迭代。

大模型驱动 AI 范式革命,紧抓产业机遇二次腾飞在即

AI 开发范式变化,模型通用性大幅提升。传统的深度学习的应用场景是根据 AI 任务搭建深度学习模型,但由于 AI 任务总是不尽相同,所以模型需要高度定制化,不同场景之间的模型难以兼容,导致传统深度学习模型的开发范式通用性较低;而预训练大模型由于采用无监督预训练的模式,训练成本大幅度下降从而催生出千亿级别参数量的模型,高参数量允许大模型可以直接面对大多数人工智能应用场景,不再需要根据特殊场景单独训练,因此模型的通用性得到了大幅度提升,AI 开发范式发生根本性改变。

AI 研发范式来看,产业的话语权逐渐由应用端走向研发端。

即变了之前完全由客户定夺市场(项目制考虑单一任务投入人力、算力、周期计算项目金额)转向由技术定义市场(MAAS,客户无法估测基础模型摊薄成本,基座模型大力投入限制参与玩家,话语权降低)。

AI 商业模式有望从项目制主打应用落地走向订阅制 MAAS 主打基础模型技术支持,产业话语权提升的带来产业链核心价值的聚集。

另一方面,由于基座模型需要大量基础资源(数据+算力+人才)的消耗,提升了进入门槛,模型能力成为核心判定指标,行业格局有望从分散走向集中。

科大讯飞享受商业模式与格局变化双重机遇。

一方面大模型赋能公司原有产品,2023 年 5 月 6 日大模型发布后,公司学习机、办公本、录音笔、讯飞听见平台、智能汽车等原有业务线功能升级,收获良好反馈。618 期间公司智能硬件产品销售位于前列。

另一方面,公司积极探索新模式,将模型能力赋予平台化及本地私有化,将提供平台型服务,以及以讯飞星火一体机为载体的本地私有化服务,双轮驱动公司有望迎来新一轮腾飞。

核心优势及壁垒:前瞻布局、抓住成长核心矛盾不断进化

综合落地能力强劲,优势显著

现阶段 AI 应用仍较为碎片化,考验厂商综合落地能力。

公司成立多年,持续加强研发增强技术实力的同时,深耕行业赛道,在技术、产品、数据&资源、渠道等方面积累深 厚,强大的综合竞争力为公司获客及应用落地提供有力保障。

技术优势:前瞻布局大力投入,逐渐成长为全栈 AI 技术提供商。公司以智能语音技术起家,是国内 AI 语音语义市场领先者。

根据 IDC 的数据显示 2019 年国内语音语义市场规模达到 12.25 亿美元,其中科大讯飞以 13.9%的市占率名列第一,超过第二名百度一倍以上。

公司在 AI 语音市场积累多年,技术在国际上屡获大奖,涉足市场广泛,产品横跨政府、消费级、企业级三大主要市场。

经过多年的发展公司技术已经不局限于 AI 语音,逐渐向 NLP、深度学习、行业知识图谱等领域渗透,逐渐构建起全栈 AI 技术能力。

数据&资源优势:卡位优质入口。

技术、数据、行业知识是 AI 应用落地的三大要素,随着 AI 技术能力不断扩散,行业知识与数据的重要性愈发凸显。中长期看行业知识与数据将是未来行业人工智能公司构建自身业务壁垒的关键。

公司深耕教育、消费者、政法、智慧城市等赛道多年,一方面与各赛道头部机构成立联合实验室,获取稀缺的专家与数据资源;另一方面公司在部分赛道积极卡位行业入口级产品,抢占数据源头,驱动自身 AI 应用产品力不断提升。

产品&落地优势:软件+硬件+平台+实施综合能力完备。

经过多年积累公司已经具备软件+硬件+实施综合化产品提供及应用落地能力。综合化能力的优势主要体现在:

1)适配性强:面对下游碎片化场景更好的推动自身 AI 产品落地(硬件翻译机更好满足出国旅行网络条件不佳时交流需求);

2)成本优势:降低自身 AI 落地成本,更好的拓展下游场景(讯飞学习机降低公司智慧课堂硬件成本);

3)获客优势:完善的产品体系及服务能力一方面有利于公司行业大单获取;

4)规模化扩张优势:现阶段 AI 产业链不完善,很多场景实际业务落地需要厂商自己实施,完善的本地服务团队有利于公司产品规模化扩张。

渠道&服务优势:AI 下游碎片化的背景下,完善的渠道与服务能力有助于公司更好的获取订单于触及客户。

尤其是 B 端,厂商后续服务能力,是客户订单招标时重要的考量要素。2015 年以后公司重点加大了渠道建设,经过多年的发展 B/C 两端已经初步搭建起完善的渠道与服务体系体系。

截至 2022 年,公司学习机线下门店数量实现 100%增长;消费者业务线下直营店开拓至 45 家,覆盖全国 15 个城市,稳步构筑起以用户为中心的全渠道线下零售网络。

积极进行组织架构变革,提升经营效率

推行增量绩效与 IPD 改革,优化内部管理效率。为了学习华为与联想的优质管理经验,2018 年公司聘请融智咨询在公司内部启动增量绩效管理及 IPD 的整体改革,通过产品树、技术树的梳理,构建产品线,将客户与产品进行细分,完善产品矩阵,建立了销售工具包,构建了对从集团到 BG 到 BU 到产品线的层层费用分包,形成了初步的增量绩效管理体系、任职资格体系以及运作支持体系。

IPD 改革使得讯飞:

1)梳理组织架构提升内部运营效率;2)细化财务模型及激励机制,激发员工主观能动性;3)建立虚拟核算及经营分析预警体系,优化内部经营资源配置;4)理顺研发、销售联动体系,提高效率。

风险提示

1、AI 技术发展不及预期:

大模型的突破有望给公司原有业务及增量业务赋能,通过打开供给催生增量需求,本次大模型创新伴随参数量及模态的增速能力天花板尚未达到,但模型效果本身仍存瓶颈及问题,倘若 AI 技术发展不及预期,公司作为投入厂商存在技术落地不及预期的风险。

2、业务推进不及预期:

公司将大模型技术与公司多项业务结合,如何实现更好的功能设计、产品落地均需要一定的时间和工程化过程,如果相关业务推进遇到困难,进程不及预期,需求方面也会遇到困难。

——————————————————

报告属于原作者,仅供学习!如有侵权,请私信删除,谢谢!

报告来自【远瞻智库】

标签: #科大讯飞的人工智能水平在国际上怎么样