龙空技术网

百度提出“深度学习+”:让创新创造大有可为

远川科技评论 8932

前言:

现在大家对“2016百度算法更新”大约比较关心,姐妹们都需要知道一些“2016百度算法更新”的相关文章。那么小编在网摘上收集了一些有关“2016百度算法更新””的相关知识,希望咱们能喜欢,各位老铁们快快来学习一下吧!

1995年,全球著名的咨询公司Gartner高德纳首次发布了“技术成熟曲线The Hype Cycle”,描绘了技术发展的几个阶段:萌发期→泡沫期→泡沫破裂期→稳步发展期→稳定产出期。这条曲线一经问世,就成为了科技领域的圭臬。

比如发布曲线这一年,著名的浏览器公司网景Netscape上市,我国第一个校园BBS水木清华成立。互联网成为大众焦点,在一声声惊叹中迎来了纳斯达克科技泡沫;不断攀升的热情,在2000年3月见顶,随后是惨烈的泡沫破裂,失望、懊悔充斥互联网和投资圈。

然而,如今的互联网,不仅诞生了一批巨头公司、创造了惊人的投资回报,也真真切切改变了世界。类似的故事,最近发生的就是新能源车,马斯克在十年亏损中才完成技术萌芽期。

Gartner曲线不仅揭示了技术发展的曲折性,也指示了一个准则:在正确的时机选择正确的技术,才能迎来良好的收益。

新年伊始,科技领域正发生的、有望迎来稳步发展甜蜜期的趋势中,人工智能领域的“深度学习”,无疑是值得关注的。深度学习,不只是科技圈的发展,更有望像“互联网+”一样,用“+”的方式,影响社会、产业各个领域、带来效率、效益的提升浪潮。

从科学怪物到4400万美金

深度学习是让机器像人类一样有神经网络,自主学习、思考,是人工智能必经之路。这个理论提出于1943年,十三年后,美国罗森·布拉特教授萌生了在机器实现神经网络的想法,并付诸实践,构思算法、模型、设备。

1957年,罗森和美国海军一起向国家气象局租借了一台价值200万美元的机器,然后将一系列在左右不同方向标记小方块的白色卡片输入机器。最初,这台昂贵的机器并不能区分卡片的不同,但读取了50张卡片之后,机器变聪明了,基本上可以正确识别小方块标记的位置了。

罗森认为,这台机器自己学会了识别技能,亲切称之为“感知机”。可以说,感知机是最早的神经网络之一。罗森对这台机器充满期待,认为机器不仅会识别图片,还会学习写字、认脸、叫名字,甚至理论上可以在流水线上克隆自己。[1]报道也惊叹,这是“海军设计的会思考的科学怪物”。

遗憾的是,在随后的近40多年里,感知机并没有做出特别震撼的动作,甚至在1969年被人工智能权威人士定调“没用”,算是给神经网络的热情上狠狠浇了凉水。

再次点燃业内对深度学习热情的信号,是2012年的一场拍卖。

美国辛顿教授和其两个学生一起研发出一套深度学习系统,思路创新、也更为精确。不仅可以识别物体,还可以理解自然语言并进行对话,以及为自动驾驶、新药研发带来了新思路。

辛顿教授发表了9页论文,向世界宣布了这个成果。并打算通过拍卖的方式,出售系统所有权。拍卖会吸引了谷歌、百度、微软、DeepMind等四家公司的追逐,报价也从几百美元上涨到了4400万美元,最终花落谷歌。随后谷歌也收购了DeepMind公司。

2016年3月,谷歌旗下基于深度学习系统的AlphaGo,挑战世界围棋冠军李世石九段,最终以4:1的战绩,令最强人类棋手不堪一击。

深度学习在中国也开始萌芽。2012年拍卖会结束后,百度也基于敏锐判断,迅速成立全球首个专注深度学习研究的深度学习研究院(IDL),发力深度学习技术。

如今的深度学习,不只是简单的图像识别,也不只是下下棋,开始逐步介入人们的生活。比如不管是特斯拉还是百度,自动驾驶的成绩,都离不开深度学习系统。前段时间全球爆火的ChatGPT机器人对话,也是深度学习的作品。

从1943年到如今,一晃80年过去了,历经多次惊喜和失落,如今,“深度学习+”的甜蜜窗口到了吗?

深度学习+,迎来甜蜜窗口

不是每一项新技术都值得关注,也不是每一项新技术都能完成“曲线渡劫”。而纵观历史来看,能够大规模普及、推动产业发展的技术,都有一个特点:通用性,具备工业大生产的特征。

一方面,这些技术自身的产业链逐渐成熟、完善,成为整个经济社会的基础设施;另一方面,各行各业也开始应用这些新技术,提效、转型,同时也有新的行业得以兴起。比如三次工业革命的蒸汽、电力、信息技术,都是如此。这也是判断一项技术,是否具备大规模应用的重要标准。

而当下的深度学习,如百度CTO王海峰博士在2019年所言,也展现出了很强的通用性,具备标准化、自动化和模块化的工业大生产特征。

对于许多企业而言,并不是不想用技术,而是技术太高深。比如深度学习的“深”和神经网络的复杂度紧密相关,而随着参数量增大、网络模型层数增多、硬件芯片增多,深度学习的开发和训练难度越来越大。但,幸运的是,深度学习,不再只是少数技术巨头的专享。

从2013年以来,百度就致力于深度学习框架的开发,深度学习框架于人工智能,可以类比为Windows操作系统于电脑产业、iOS和安卓等系统于移动时代。而且,百度也对产业级深度学习平台飞桨,进行了开源。

在标准化上,依托飞桨动静统一、高低融合的API体系,模型开发成本实现大幅降低。从“共聚”、“共研”到“共创”,飞桨携手超过30家硬件生态伙伴,全面降低了硬件适配成本,实现硬件跨平台统一。

自动化上,飞桨实现了端到端自适应分布式训练技术,支持大规模高效训练;推出训推一体工具链,大大提升模型训练、优化到推理部署全流程开发效率。模块化上,飞桨产业级模型库创建了超过600个低代码模型。文心产业级知识增强大模型系列就是飞桨模型库中的重要部分。

通过飞桨平台,开发者和企业可以使用低代码、甚至零代码的开发套件、工具组件,更快速、便捷地开发AI应用,避免重复“造轮子”,也降低了造轮子的难度。

形象点说,可以像搭乐高积木一样使用深度学习。

独木不成林。一项技术的普及,也离不开生态的支持。就像电动车的发展,不只是车的事情,包括锂矿、电池、一体化压铸、充电桩、快充等等要素的支撑。而深度学习也和芯片、模型、应用等上下游,一起已经构成了良性生态。

比如,芯片层,支持深度学习训练、推理的芯片类型越来越丰富,包括英特尔在内的超过30家硬件厂都与飞桨深度学习框架进行软硬一体联合优化,性能、效率,都越来越高,为深度学习发展提供了强大的算力。而模型、框架等发展,也让深度学习效率更高、门槛更低。

在教育生态方面,飞桨和高校一起,围绕学习、实践、认证、比赛、就业等环节,将高校科研人才与企业应用人才培养紧密结合。飞桨也通过实施进阶式培训,帮助企业加速应用深度学习。

从昆仑芯片、飞桨深度学习框架、文心大模型,到搜索、智能云、自动驾驶、智能家居等应用,百度在每一层都有扎实的核心技术及应用,能够不断获得反馈,驱动创新,加快迭代进化。

打铁自身硬、生态众乐乐,可以说,“深度学习+”的甜蜜阶段正扑面而来。1月10日,“创造者精神——百度Create2022”大会召开,这是全球首个专注AI开发者的科技盛会。在会上,百度CTO王海峰博士开创地提出,人工智能的技术创新和产业发展,进入“深度学习+”阶段。

深度学习+,也是对时代的回应。党的“二十大”提出了质量强国、数字中国等战略,那么产业发展如何向数字技术、深度学习要效率呢?

千行百业如何在“深度学习+”中提效?

隔行如隔山,人工智能虽然很聪明,但是它能了解所有行业?能针对不同行业,做出不同的分析、应对吗?

这是许多企业主在接触技术产品时的疑惑,也是深度学习的码农们致力解决的问题。而一个思路,就是百度CTO王海峰博士提出的“深度学习+知识”

知识,凝炼了人类认识和改造世界的智慧,老师傅们的经验,甚至一句顶万句。而深度学习,则弥补人类学习的瓶颈,发挥机器的高效属性,可以24小时不吃不睡,沉迷在知识的海洋。二者的结合,就是知识增强的深度学习。产品的落地形态,就是百度的文心大模型

2019年,百度开始深耕预训练模型研发,先后发布知识增强文心(ERNIE)系列模型。2021年,百度与鹏城实验室联合发布全球首个知识增强千亿大模型鹏城-百度·文心,参数规模达到2600亿。2022年,百度又先后发布了数十个大模型,其中有11个行业大模型。

文心行业大模型以通用模型为基础,通过和行业内资深的头部企业、机构合作,实现“从产业中来,到产业中去”,通过场景应用、行业数据融合等途径,反馈、更新模型。已经覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域。让秀才和兵,其乐融融。

比如在飞机检修领域,深度学习就发挥着功效。为保障飞机安全,航线维修人员需要对每架飞机进行全面检修,涵盖几十个检查项目、涉及成千上百个零件。尽管每位检修人员都尽职尽责,但如果可以用人工智能来辅助,不仅可以减轻维修人员的负担,也会为安全再上一道防线。

然而,有经验的检修人员,不擅长算法;会编写算法的码农,又不懂飞机检修。如何破局?

四川赛福威飞机维修服务有限公司的员工,机缘巧合发现了百度飞桨EasyDL零门槛AI开发平台,并通过将工作照片大量上传、模型训练后,便在飞桨上开发出了AI检测系统。比如在空速管检测中,检修人员对飞机每个空速管位置以及取下的空速管套现场拍照,然后上传到系统中即可完成检测。

而针对重要的飞行记录本,也可以通过AI实现签名识别,飞机状况、放行时间等等信息,一目了然。这些AI检测,既给安全加了一道保险,也规范了操作流程,同时也提高了信息对接、确认效率。

再比如,制造业对产线稳定性要求高。但产线涉及的设备杂、数量多,日常运维并不是件容易的事儿,对资深员工依赖度高。而通过“深度学习”,可以让企业拥有一批资深员工。

通过对设备的历史维护数据、设备使用手册的学习,基于自然语言理解技术,可以自动识别设备故障、推荐维护建议等。即使遇到不熟悉、不擅长的产线故障时,通过深度学习系统,也能够及时获得专业的维修建议。

在农业领域,通过精准的图像识别、模型训练,判断出蔬菜重量,以及其生长是否健康、能否采收,同时也能第一时间发现害虫、降低损失。

百度飞桨的低门槛,相当于为企业配置了“一整个算法团队的能力”,而各行各业的使用者,又将专业经验反馈,使得算法更加聪明。每一位使用者,又都是“深度学习+”发展的创新者。

尾声

我们有着全球最丰富的工业体系,产业纵深全球领先,这是技术展现的广阔天地,也是技术本身得到反馈、提升的沃土。

凯文·凯利曾说,“技术如何可以让一个人变得更好?只有一个方法:通过给每个人提供机会”。那么,技术如何可以让一个社会变得更好?

也许也只有一个办法:通过给每个产业、每家企业提升效率。这也是“深度学习+”的使命和目标,成为创新发展的新引擎,让创新创造在中国广阔的产业大地,大有可为。

参考资料

[1]深度学习的革命,凯德·梅茨,中信出版集团

标签: #2016百度算法更新