深耕大模型，一个AI先行者的9年实践

市界观察 07-12 474

前言：

现在咱们对“imagenet公司”可能比较关心，同学们都需要学习一些“imagenet公司”的相关内容。那么小编同时在网络上收集了一些有关“imagenet公司””的相关内容，希望各位老铁们能喜欢，同学们一起来学习一下吧！

上市一年有余，“AI第一股”商汤科技再次交出了一份稳健的业绩答卷。数据显示商汤科技2022年营收达38.09亿元，毛利率为66.8%。

2021年12月30日，商汤科技成功登陆港股，造就了全球AI（人工智能）领域最大资金规模的IPO。

彼时，产业已经渡过早期的喧嚣，开始迈进发展的深水区，质疑伴随着市场的理性情绪一起到来。这样的背景中，坚持对AI基础设施SenseCore进行研发投入的商汤科技走上了一条孤独之路。

彼时没人能想到，一年之后，NLP大模型ChatGPT在全球掀起热潮，吸引无数企业和资本争相涌入这一领域。

对于商汤科技而言，从2014年成立开始，对大模型及相关技术的积累就贯穿于企业的生命线之中。发展至今，公司已经摸索出属于自己的独特发展路径。

作为长期深耕底层技术研发、不断探索和更新商业化路径的“领先选手”，一幅值得期待的蓝图正在商汤科技面前慢慢展开。

大模型热潮中的稳健标的

早在1965年，人工智能先驱、图灵的老师司马贺曾乐观预测道：“在20年之内，机器就能够做到一个人能做到的任何事。”

遗憾的是，技术的发展与迭代难以预测。随着产业发展，研究者们将这种理想的模型概念进一步扩充为“通用人工智能（Artificial General Intelligence，AGI）”——具有一般人类智慧，可以执行人类能够执行的任何智力任务的机器智能。但尽管一代代研发者进行投入，通用人工智能的实现仍旧遥远。

直到2022年末，NLP（自然语言处理）大模型ChatGPT横空出世，这个上知天文、下知地理的生成式AI模型让人们意识到，或许人类终于敲开了通用人工智能的大门。这也是比尔·盖茨评价ChatGPT诞生“意义不亚于互联网和个人电脑的诞生”的原因。

技术跨越式演进掀起的热潮，终于让资本意识到了超大模型的研发价值。

仿佛一夕之间，对人工智能的投资再次成为主流话题，不仅一级市场中“生成式AI项目”成为追逐热点，国际科技大厂纷纷入局；二级市场中，相关概念股的股价随之水涨船高。

然而，突击式的投资、对热点和市场情绪的追逐，从来都不是人工智能产业发展的“脉搏”所在。就像商汤科技董事长、首席执行官徐立在2022世界人工智能大会上曾说过的：“人工智能和天文都是寂寞的科学，需要大量且漫长的长期积累。”

随着产业发展趋向于理性，狂热的情绪终会消弭，企业实力才是玩家们最终能否赶上这一波大模型风口的关键点。

对AI企业而言，保持技术和产品的先进程度、积极探求商业化的可能性尤为重要。

从这两个角度而言，商汤科技均已走在了行业的前头。

基于此前积累的技术能力，2023年3月14日，商汤科技开源了多模态（指能够处理文本、图像、音视频等多种数据类型）多任务通用大模型“书生（INTERN）2.5”。

书生2.5在多模态多任务处理能力方面实现多项全新突破，具备图文跨模态开放任务处理能力，可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

这也是在ChatGPT掀起大模型热潮之后，国内较早发布的自研大语言模型。从发布当日起，书生2.5就在通用视觉开源平台OpenGVLab上开源。

▲（书生2.5，图源/商汤科技）

在保持技术领先的同时，商汤科技还在持续优化自己的盈利能力。

根据最新发布的2022年业绩报告，商汤科技业务结构实现转型，智慧生活、智能汽车、智慧商业、智慧城市四大业务线矩阵全面升级，其中智慧生活、智能汽车整体收入均大幅上涨。

“大模型+大装置”长期战略彰显前瞻性

早在2015年，商汤科技就开始研发深度学习训练框架SenseParrots，并逐渐以此为核心、持续研发攻坚，搭建起AI基础设施SenseCore，赋能千行百业。

至今，商汤科技仍保持着稳定、高水平的研发投入。以2022年为例，商汤科技研发投入达到40.14亿元。同时在2022年，商汤科技的人均研发效率持续提升，人均每年研发模型数相较于2021年进一步提高了90%，达到9.35个。

这种对SenseCore AI大装置的长期投入，成为了商汤科技能够在大模型潮流中保持领先的“底气”。

SenseCore建立在AI原生基础设施层、深度学习平台层、算法模型层之上，打通了算力、平台、算法。基于此，商汤科技能够将不同层次的能力按需调配，进行流畅、标准化、端到端的AI模型自动生产过程，也就是提供AIaaS（人工智能即服务）。

▲（商汤科技SenseCore AI大装置，图源/商汤科技）

SenseCore AI大装置的特点，可以被归结为普惠、弹性、开放这三个词语。其所提供的AIaaS具体包括IaaS（计算基础设施服务）、PaaS（深度学习平台服务）、MaaS（模型部署及推理服务）三大部分的能力。

不论是大模型客户，还是垂直领域内的中小模型客户，不论是需要成熟模型迁移的用户，还是AI模型研发者，都可以借助SenseCore“搭配”出适合自己的解决方案。

在此前的实践中，商汤科技已经赋能了许多行业的2B客户，截至2022年末，商汤科技累计生产的商用AI模型达到了6.7万个。

在大模型领域，SenseCore AI大装置同样经受得起考验。2022年，商汤科技全面布局生成类预训练大模型，实现并完善了文本、语音、图像、视频、3D场景的多模态生成能力。

年内，商汤科技SenseCore AI大装置持续扩建，完成了2.7万块GPU的部署并实现了5.0 exaFLOPS（每秒浮点运算次数，一种计算速度单位）的算力输出能力。在这一基础上，SenseCore AI大装置最多可以支持20个千亿参数量大模型（以千卡并行）同时训练，最高可支持万亿参数超大模型的训练。

在通过各类资源的精准组合来保证大模型训练效果这一方面，商汤科技已经用实践证明了自己的实力。

以商汤科技在2023年初开源的多模态多任务通用大模型“书生（INTERN）2.5”为例，书生2.5拥有30亿参数，是目前全球开源模型中ImageNet准确度最高、规模最大，同时也是物体检测标杆数据集COCO中唯一超过65.0 mAP（全类平均正确率）的模型。

至今，SenseCore已支持了超过10个大模型训练项目，其中包括语言大模型、文生图模型、视觉大模型、多模态模型等商汤自研模型和客户自定义模型。

在服务8家客户进行大模型训练的过程中，商汤SenseCore AI大装置总共提供了7000多张GPU。

追寻技术最高目标的“长跑”

如果说近期各类大模型的兴起，敲开了通用人工智能的大门，那么，什么时候才能实现真正的通用人工智能？

对这个问题，还没有人能给出答案。就像OpenAI（ChatGPT大语言模型的研发机构）创始人Sam Altman说的那样：“我对此只有一个新的认识，那就是它不会是一蹴而就，而将是一个渐进的过程。也就是“缓慢起飞”。人们对什么时候能实现AGI，不会达成共识。”

不过，可以确定的是，我们正处在不断逼近技术终极目标的长征路上。每一项人工智能的技术创新，都有望成为哺育新兴业态、促进既有商业模式焕新、解放生产力的一片肥沃土壤。

据Gartner预测，至2023年将有20%的内容被生成式AI所创建；至2025年生成式AI产生的数据将占所有数据的10%（目前不到1%）。另据红杉预测生成式AI将产生数万亿美元经济价值，到2025年，国内生成式AI应用规模有望突破2000亿。

而在这条通往通用人工智能的路上，唯一的“钥匙”就是坚持研发和投入，秉持不断试错和调整步伐的耐心与决心。

从2014年成立开始，商汤科技已然踏足这条对技术终极目标的追逐之路，成为整个产业中的标杆玩家。未来，商汤科技仍将继续这场“长跑”。

商汤科技表示，未来公司将继续把实现通用人工智能作为核心发展战略，并从5大方面进行深入挖掘和探索。

具体来说，公司将以SenseCore AI大装置作为大模型生产的核心平台，持续扩展大装置的能力，包括投资高性能计算基础设施例如高速网络、大规模数据存储以及强大的计算节点。

商汤科技还计划将多模态大模型的研发作为战略投入方向，不断提升大模型的数据理解和生成能力、多任务泛化能力。

另外，商汤将与全球领先的芯片制造商、全球研究机构、高校和企业展开合作，共同探索算力优化的新途径，推动AI算力的发展。

为了确保AI技术的发展惠及全人类，致力于降低AI技术的成本和门槛，商汤科技将通过开源项目、共享资源和合作研究等方式，与全球AI研究者和开发者共同推进AI技术的发展。

在商业化角度，商汤科技将推进大装置和大模型能力对智慧生活、智能汽车、智慧商业、智慧城市四大板块赋能。通过充分利用大模型的能力，不断升级、强化四大业务线产品矩阵，提高产品竞争力，以商业化为抓手提升人工智能在各行各业的应用。

市场热情如潮水般时涨时落，而对硬科技企业而言，追逐热点势必难以攀上技术的高峰。想要达到技术的下一阶段，坚持长期主义才是唯一的方法论。

就像商汤科技董事长、首席执行官徐立在接受采访时曾提到的：“商汤科技优势在于长线的人工智能发展思维及商业落地的能力。我始终认为，技术运用到行业中是有工业使用的红线。如果技术没有达到红线，就很难发挥商业价值。”

在真正到达通用人工智能的“彼岸”之前，AI产业中还需要更多如商汤科技一般的玩家，对长期主义施以实践。

参考文献：

《人工智能推动世界前行》，新华访谈

作者 | 董温淑

编辑 | 董雨晴

本文地址：http://www.longkongtuishu.com/ca467A2sAAlUFDw.html

标签： #imagenet公司