龙空技术网

ChatGPT和大模型,数字人的“及时雨”?

西局科技 98

前言:

而今我们对“数字搜索引擎”大致比较看重,大家都想要知道一些“数字搜索引擎”的相关文章。那么小编也在网上收集了一些关于“数字搜索引擎””的相关文章,希望大家能喜欢,咱们一起来学习一下吧!

数字人又“火”了。

6月13日, 360正式发布“360智脑”大模型应用,同时,360的AI数字人也正式推出。在360智脑大模型内测版本上,包括“孙悟空”“诸葛亮”“爱因斯坦”等数字人已经上线;据了解,目前360 AI数字人已拥有200多个角色,还支持定制,生成自己的专属数字人。在发布会现场,360集团创始人周鸿祎创建了自己的数字分身,并与“马斯克”“孙悟空”“诸葛亮”等数字人进行了对话。

周鸿祎表示,360在大模型上的核心创新在AI数字人,未来人工智能大模型最重要的应用入口是数字人,而不是浏览器、搜索引擎等。

早在今年3月,周鸿祎和搜狐创始人张朝阳在《星空下的对话》中谈起当时火热的ChatGPT时,就提到了数字人:“ChatGPT+AI数字人=张朝阳的数字永生,搭不上这班车的企业或被淘汰。”

近期来,多家拥有数字人相关业务的A股上市公司也纷纷通过公告、投资者平台和媒体宣布接入类GPT大模型。

热点概念总是转换得太快。从元宇宙到大模型,不过也就是一年的时间,风口轮转。而数字人,也成为连续近年来,连续踩中了“元宇宙”和“大模型”两大风口的概念之一。实际上,元宇宙的热度逐渐下降之后,数字人的声量也随之放低,市场上更是出现了价格体系混乱、产品同质化的问题。

从元宇宙的入口,发展到现在,数字人似乎正借助ChatGPT和大模型获得“新生”。但除了数字主播之外,大众尚不太熟悉的数字人,其价值又究竟何在?

数字人,已占领直播间?

在商业咨询顾问刘润的抖音账号中,可以发现,近期其不少短视频中,都打上了“本视频使用数字人技术制作”的提示。其中出镜的都不是真人,而是刘润的数字人分身。

在很多中小商家的直播间里,也早已由数字人,代替了真人直播。这些数字人通过播报商品信息,引导用户去下单买券等。

一家企业表示,他们联系了一家数字人提供商,只需要提交一段真人3分钟的演讲视频,对方就能很快生成数字人主播,形象和真人所差无几,连声音、语调都大差不差。虽然它的动作单调,只能简单地对口型、摇头、扎眼等,也只能播报提前给到的文字内容,但是对于不需要互动的直播间来说,还是省心、省力多了。而且,制作的花费,也并不贵。有的厂商会直接提供客户模板来制作数字人,使用一年也不过两三千元的费用。

而虚拟主播,不过是数字人产业崛起后,商业赛道上的一个缩影。

2020年,随着元宇宙的爆发,无数虚拟数字人涌现。包括冬奥会的气象主播冯小殊、万科员工崔筱盼、抖音美妆博主柳夜熙、虚拟明星AYAYI等,不一而足。

其中,柳夜熙在2021年发布了其第一条视频6小时后,账号涨粉就达到10万,30小时后突破130万;一周后,柳夜熙的粉丝数量达到430万。目前,其已拥有842万粉丝。

(图:柳夜熙抖音账号的作品,抖音平台截图)

在这之前,很多人认识的数字人,还是从“二次元”年轻人们喜爱的初音未来、洛天依等虚拟歌姬,以及乐华娱乐推出的旗下虚拟偶像团体A-SOUL等开始的。但现在,通过短视频平台,无数普通消费者,一夜之间就被这类高度拟人的数字人占领了心智。

随着计算机CG、建模、渲染和动作捕捉、语音合成、AR/VR等技术的发展,数字人的形象也不断迭代。从最初的二次元2D动画形象,发展至今,已经越来越“真假难分”了。像柳夜熙,就是超写实数字人的代表形象之一,形象写实程度极高。

数字人产业发展走上“快车道”,也是多方面因素作用的结果。

元宇宙的东风下,数字人被业界赋予了更大的期待,也拓宽了对其应用场景的想象。例如,它可以作为用户本人在元宇宙空间的另一个身份标识而存在,像电影《头号玩家》里展示的一样,玩家可以通过设备进入虚拟空间,在其中绑定自己的虚拟“分身”,进行操作。这种身份型的“数字分身”,和微信、手机号码一样,将成为用户主体的延伸。

在现实世界中,消费互联网已经接近天花板,用户的在线时长、各种移动终端的开发等等,想要再进一步挖掘,都已经是难上加难。与之对比,虚拟世界,无异于是一块待开发的“净土”。虚拟场景中,数字人就理所当然地,成为了交互的新入口。

在这种想象空间的激励下,数字人概念跟着元宇宙一起水涨船高。同时,随着短视频、直播电商等对内容生产需求的爆发,大量的数字人形象和IP涌现,不少企业也借机和知名数字人联名,或干脆推出了属于自己的数字代言人。数字人产业迈入了新的时期。

早期的虚拟歌手,包括虚拟博主、虚拟代言人,制作方的目的大多是打造独立IP,再进一步实现商业化。这类数字人也被称为身份型数字人,作为真人形象的投射,被设置了独属的外表、个性化的“人设”等。

固然这些形象不比真人明星,没有自己的故事作为支撑,未免有些“虚无缥缈”,但对于新生代的“Z世代”群体来说,这种玩法也不陌生。就像迪士尼打造的小狐狸形象“玲娜贝儿”能够走红一样,这类数字人形象通过人设,也和消费者们建立起了情感上的链接,并拥有了自己的粉丝。通过出售周边、为企业提供形象代言、直播打赏、进行演出等模式,它们给自己的制作方也带来了营收。

(图:虚拟人AYAYI,图源:AYAYI微博头像)

帮助数字人拓展了更大应用空间的,是AI技术的发展。随着深度学习算法取得突破,自然语言理解NLP和机器视觉等技术日趋成熟,由“算法驱动”的数字人开始出现,可以智能交互的数字人,逐渐露出头角。

《企业级AI数字人数字经济发展“新动能”》白皮书中,就将数字人的发展分为了5个阶段。大多数数字人,在前两年已经走到了第三阶段——依赖算法驱动,数字人可以实现口型、肢体、表情等动作,并且,它可以在简单的对话场景里,和用户实时交互了。

这意味着,数字人能在部分限定场景里“独立工作”了。随着开源跨模态深度学习模型推出,底层技术获得突破,深度学习的应用也重塑了数字人的制作流程,各种图文和音视频数据采集后,通过模型训练,可以快速创造出复刻真人语音、外貌的写实数字人。

大量的数字人,开始涌入直播间,“抢占”了一部分小主播的地盘。尽管它的交互能力还没有那么强,但胜在“量”上,也能帮助不少商家控制成本。

从这个层面来看,数字人可以作为企业代替真人服务的“数字员工”之一,得以存在了。

另外一个例子是,在2023年初,万科董事会主席郁亮在微信朋友圈里发文,恭喜“崔筱盼”成为万科集团优秀数字员工。

这是崔筱盼第二次获得嘉奖了。这名拥有年轻女性形象的万科员工,不是真人,而是数字人。2021年入职后,通过学习财务知识,崔筱盼在看到财务数据的同时,会选择合适时间去提醒应收账户,以实现社会资金的高效周转和现金管理。因其催办的预付应收逾期单据核销率达到91.44%,崔筱盼还拿到了当年的万科总部最佳新人奖。

据郁亮发文显示,在2022年,崔筱盼的工作范围由资金、财务,拓展到了投资、融资、工程、成本、营销、运营等职能。

此外,招商局集团在去年底推出了数字员工“招小影”,实现了在招商随行办公协同平台落地,可进行工作汇总、信息通知等,并具备业务自动处理能力,辅助员工实现数据服务入口的统一。

元宇宙的“入口”故事还能讲吗?

有趣的是,数字人和其他互联网产品相比,存在一个明显的不同:虽然在互联网时代走红,它却缺乏C端应用的土壤。目前为止,C端用户对之仅止于好奇,而真正提出应用需求的,都是B端企业。

毕竟,B端企业最为了解Z世代用户的价值,也对蓬勃发展的科技浪潮最为敏感。应用数字人,也是它们基于对新市场的了解,出于获取新用户、提升品牌价值、增强用户体验的目的。

基于IP,数字人在品牌营销上的价值更容易被挖掘。所以,也可以看到,现有的企业应用数字人的核心场景,多数是利用虚拟IP,打造营销的新场景,吸引新用户,同时也可以提升品牌的科技感;此外,通过数字人的智能交互等功能,实现对用户的服务。像银行的虚拟客服、旅游景点的虚拟导游、在线课堂的虚拟教师等等,成为大众最常见的企业中的数字人。

但基于B端需求得以爆发的数字人产业,也必然面对这样的考验:它能够足以激发用户的兴趣,并且能够比原来的人类员工应用成本更低。

但数字人显然还具有自己的局限性。它的应用类型,目前依然是以带有IP的身份型数字人为主,约占了当下市场的九成左右。随着直播行业的巨大内容生成需求崛起后,其应用场景也主要仍是集中在直播领域。

但起于直播,数字人也限于直播,应用场景仍然有限。

同时,受限于技术,目前的数字人交互能力仍然有限,表达也比较单一。这也是不少使用它的企业和用户的直观感受:不少数字人主播仅限于播放事先录制好的内容;或者在互动时的对话还比较尴尬。因此,直播带货时,不少电商选择虚拟主播+助理的模式,或者是由“中之人”操控,给真人套上虚拟主播的外表。

此外,要打造目前流行的超写实数字人,昂贵的成本也是一大制约因素。柳夜熙的制作方创壹科技创始人梁子康曾对外表示,柳夜熙的制作投入,包括人员成本、技术成本等约在百万元级别,其2021年11月推出的第一条柳夜熙短视频,成本约为几十万元。

当前的技术水平,还不足以让数字人,支撑起元宇宙讲述的全新“入口”故事。现在,元宇宙最火热的阶段已过;而数字人在元宇宙中,至今还没有出现过更有说服力的代表性产品。

当数字人只有外貌上的区别,在交互能力和功能上却大同小异时,当用户最初的新鲜感逐渐过去后,这类应用“同质化”的问题也随之凸显。数字人提供商们,也开始在价格上“卷”了起来。

但是,它拓展出的想象力,已经和企业应用的现实场景得到了结合。因此,当数字人亟需破局时,ChatGPT和大模型的新风口,给了它新的机会。

大模型下了一场“及时雨”

在不久前的发布会上,360也表示,数字人将成为未来AI大模型最重要的应用入口。没有大模型支撑时,数字人只能按照既定脚本输出内容,不能交流,也没有性格、记忆。而360推出基于大模型激活的数字人,并提出了“有灵魂的数字人”概念。

比如在现场,周鸿祎展示了“法务专员”数字人校色,对企业中常见的公章管理和合同审核问题,作出辅助。

实际上,这和崔筱盼、招小影等数字员工,本质是相同的。但基于大模型,数字人的“大脑”得以扩容了。

“GPT-4 为代表的大模型推出后,最核心的变化就是,服务型的虚拟人在理解用户意图和回答问题上能做得更好了。”Honnverse虹宇宙首席品牌官吴璇曾对外表示。

相比于传统的对话引擎,接入GPT大模型后的数字人,能够有效地输出更加接近人类口吻的回复,对很多的问题的理解也更加到位。例如,结合AIGC的功能,泛娱乐领域的数字人能实现与观众的实时互动;在金融、文旅、教育、医疗等领域则能更好地完成智能客服和专属顾问的沟通工作。

在这种情况下,实际上,数字人被赋予了更大的产业意义——它成为产业大模型辅助企业进行数智化转型,在落地应用层的交互入口。类似于目前的AI助手,但它比起AI助手来在视觉和交互上更加直观,拥有独特的外表以及人设,既可以作为品牌营销工具、提升企业的品牌价值,也可以拉近和用户的距离;同时,它还可以和企业的信息化后台打通,成为企业名副其实的数字资产。

在交互方式上,随着AI技术的突破,或许未来的数字人也能够更加流畅地通过语音等方式,和用户实现实时交流。

也因此,国盛证券曾提出,随着算力的提升以及GPT-4的模型升级,数字人将成为GPT-4之后、承载多模态的杀手级应用。

另一方面,大模型出现后,数字人的制作流程也被重塑,在制作环节上,数字人也实现了降本提效,为商业化应用提供了可能。

在元宇宙概念热度下降后,除了直播领域外尚未找到应用突破口的数字人赛道,无异于又迎来了一场“及时雨”。

今年4月25日,腾讯云发布智能小样本数智人生产平台。通过该平台基于通用多模态大模型技术,只需要3分钟真人口播视频、100句语音素材等小样本,便可通过多模态数据输入与实时建模,制作出与真人近似的“数智人”。

4月份,商汤在发布的“日日新”大模型体系下,也上线了如影数字人视频生成平台,也可以通过一段5分钟真人视频素材生成数字人。

5月份,小冰公司宣布启动“克隆人计划”,最短需个人采集三分钟数据,即可为用户创造源于本人性格、技能、声音、外貌的AI克隆人。6月1日,小冰首批网红明星“克隆人”上线,用户可以在X Eva App中与AI克隆人交流,其中包括了引起网络热议的网红“半藏森林”的AI克隆人。

(图:小冰首批克隆人上线,AI小冰微信截图)

数字人行业再度进入活跃期。在直播间和业内活动上,不同主播、主持人和大佬的数字“分身”,屡见不鲜。垂直行业的公司们,也在寻求数字人的落地新方向。像顺网科技,就在不久前宣布其旗下数字人“晓竞”已将AIGC应用于电竞酒店行业,帮助酒店业主实现智能经营,自动生成营销内容,满足商户在实体经营中对数字营销的需求。唱吧也以其CEO陈华真人形象为基础,打造了基于ChatGPT技术的智能数字人“托尼”。

但这仍然是一个处于萌芽期的产业。数字人的商业化落地进程,仍然还需要进一步的探索。但无论如何,ChatGPT不是元宇宙的“对手”,而是为其提供了新的动力,在AI技术为数字人提供了美丽的“皮囊”之后,助力其打造更加有趣的“灵魂”。

标签: #数字搜索引擎