龙空技术网

吴军长文讲解算力:阿里云的超级智算是“直道超车”

火星方阵 31044

前言:

此刻我们对“软件技术阿里云计算方向”大致比较讲究,看官们都想要学习一些“软件技术阿里云计算方向”的相关文章。那么小编也在网上搜集了一些关于“软件技术阿里云计算方向””的相关内容,希望姐妹们能喜欢,我们一起来学习一下吧!

这两天看到吴军的一段访谈,绝对是在算力这个话题领域中最深入浅出的一篇讲解了,把算力的概念、演进趋势,再到与经济发展如何挂钩、中国算力产业的发展方向,做了一个非常完整的梳理。

其中,吴军提到了算力竞争中,中国算力产业应该做的三件事:一是建设基础设施规模,二是提升算力效率,第三是在基础设施上提供足够的开发能力。“把算力正式用起来,要把这些事做完了以后,这个算力才真正能够惠及到企业,惠及到个人。”

整理了一下访谈全文放在这里,内容比较长,耐心看:

提问:现在很多人说到算力都会想到矿机、比特币,算力应该有一个更广泛的含义,应该怎么理解什么是算力?

吴军:算力我们得打一个比方能够解释得比较清楚。过去人类经常用来衡量各个国家或者各个文明时代它的文明程度的一个标准,就是能量,一个国家它的文明程度高,它使用和能够产生的能量总量以及它的效率就会更高,比如我们说现代文明比古代文明能量要高,这是历史学界惯用的一个方法。

到了近代以后,能量的重要性相对次要了,信息的重要性就很强了。举个例子,几秒钟你就传输一部高清的电影,如果放到最早有电话的时代,用电话线来传,那可能是几万年甚至是几百万年才能传这样一部电影,这就是信息它本身的进步。

算力本身跟信息这件事挂钩,一个文明或者一个国家它能够产生和利用的信息的总量,这个事和算力是挂钩的。

信息我们怎么用它呢?最基本的就是三个用法,第一个是我们要能够处理信息,第二个要传输信息,第三个要存储信息。这三件事今天都是通过计算机来完成的。计算机能够处理传输和存储的信息总量,我们一般可以把它看成是算力。

用我们熟悉的发电作比喻,发电量的背后是一台一台的发电机,也一样的道理,算力的背后是一台一台服务器、处理器、芯片。

算力在过去70年的发展非常快,1946年出现了世界上第一台计算机,到2016年AlphaGo下棋赢了李世石,这个事很轰动,但如果用70年前的技术来算,那需要用百万个三峡水电站的发电量来维持这盘棋,所以说算力的演进非常快。

一个是物理的演进,电子计算机出来以后,最早是真空管,可以理解成一个灯泡,它加热了,红了,能够发出一点光,就可以开始工作了。当时计算机很庞大,大概用了几万个这样的灯泡。它一旦启动起来,老百姓家的灯泡就黯淡下来了,因为它实在是太耗电,每秒钟只能算5400次。后来用硅做晶体管,取代了原来的灯泡,同样的能量可以把计算提高100倍。第三部,大家发现把这些电路做到硅片里头,做集成电路,计算又提高了几百倍,而且每十年提高几百倍,这个就是摩尔定律。

但到了2000年前后,这条路就停在哪里了,为什么?因为一个比小拇指的指甲盖还小的芯片里头,它已经有了在几十亿个晶体管了,那个晶体管密得不得了,这个计算的速度相比电传输的速度来讲,电传输速度已经是一个瓶颈了,不可能突破电的传输速度,所以它不太在提升了,还能提升,那就很慢了。所以,这时候是个分水岭,进入了21世纪以后,大家追求的目标不再是单独一个处理器它能提供多少算力,而是我要考虑到它用多少电,比如说每一度电提供多少个算力,标准基本上就改成这个。

这时候大家开始优化软件,有A路径B路径C路径,比如无人驾驶和挖矿就是不同路径,按从2000年到现在,通过不同路径,又把算力提高了几万倍。比如2000年以后出现智能化,就开始用专用芯片。

另一方面是商业。一开始庞大的计算机,耗电量那么大,当时就是IBM做大型机,大家来组,他收每年的服务费,收的服务费,比如这一整套设备的费用每年收10%左右,IBM每年服务费收很多。我以前有同学在IBM工作,被派到花旗银行去干这种事。这是一个时代,就是大家租算力。

到PC机出现了,每个人家里有电脑。我们就不租了,各个单位买了一大堆电脑,人手一台。但是电脑使用效率其实很低,除了上班几个小时用,晚上都闲着。如果突然有个计算,这个任务特别繁重,我一下要用500台电脑,你是没有的,你家里不可能有500台电脑。单位里,这500台电脑这一年就用这一次,也不为你这一次去买这500台电脑。所以从租到不租,第二个阶段还是有很多问题没解决。

到了2000年以后,网络速度变得特别快,能不能把所有的高性能服务器都放在一起,放到一个数据中心里去,然后我再去卖算力。为什么呢?效率比较高。我可以给大家一个数据,我原来在某一家大公司里工作,因为各个部门之间的电脑不是放在一起使用的,统计一下电脑处理器使用的效率不到10%,这已经是大型的计算机公司了。今天的数据中心,他们处理器的使用效率都在百分之七八十,一下子能够提高七八倍的效率。其实这个就是我们今天说的云计算,商业模式和IBM以前那种有点像,但其实完全不一样了。

接下来要进入第四个阶段,IOT的设备很多,有好多计算需求,很零碎,如果每次都把请求发到云端再计算,效率实在太低。大家就想,比如说一个小区有一两台服务性能比我们家电脑当然要强很多,那我也不需要云计算中心那么大的算力,一个中等规模的,你能做到多大呢?女生背的一个手袋吧,这么大一个盒子,能够处理一栋三四十层大楼的IOT计算的请求,就是做这个,中间状态的它叫做边缘计算。那么城市和国家有超级计算中心,社区和小区有边缘计算,是这样一个过程。

提问:现在说全球进入了算力竞争时代,算力和经济发展是怎么挂上钩的,或者说算力怎么帮助和促进经济发展?

吴军:算力可以理解成发电量,根据发电量大概能够判断出经济形势怎么样,算力也是一样的。从第二次工业革命以后,服务业它在全世界GDP中占的比重越来越高,传统的工业农业就开始萎缩。今天一个国家经济水平的高低不在于说你生产了多少辆汽车或者说日常消费品,而在于你提供了多少高端服务,金融的、科技的、医疗的、财务税务的、法律的等等这些。

所有这些服务,它都跟计算机有关,你可以想象这些行业它都是离不开计算机的,比如医院里一个核磁共振的仪器,它是一台巨大的计算机。做好服务业,还有一个效率的问题,或者现在说是智能化的问题,举个例子,一个律师打官司,为了打这个官司,你要看以前的很多卷宗,比如说5000个案例,用人来看,那效率很低,你找好多助手来看;你也可以用这个计算机来看,我们说人工智能可以阅读这个案例,大家能够明白怎么回事,给你写一份报告,但你就省了很多时间。

如果用人工智能来看,你就要用计算机,就是运行一些人工智能的程序。这些程序它很耗时间,比如你家里只有一台苹果电脑,你运行很长时间才能行,那你就需要通过云计算来做到这件事,因为人工智能计算是很消耗算力的。你如果能够提供算力,它就可以用AI来做一些在法律上的服务。这种例子有很多。

手机、电脑自己也有算力,这和云计算的关系是什么呢?打个比方,你家里的算力相当于是你家里有好多电池,你的电器你用这电池是没问题的,你在家用一用,或者在耗电量不大的情况下,你用这电池来供电就行了。

云计算公司提供的算力相当于插头220的交流电,你到了哪,你带一个插头去就行了,你一插,插上就能用。如果你需要一个很大的算力,你们家的电脑就做不到,它可以提供,把电输给你,你一插,那就享受到它的服务。你可以想象成,一个是家里的电池,一个是墙上的220V。

当云计算的公司提供更多的算力的时候,你家里就可以做各种各样和计算相关的事情,那么你家里的智能化程度也高,放在一个社会上,社会的智能化程度也高,或者说这个国家它的文明程度竞争力也就更强了。

当一个国家经济到一定程度的时候,我们叫转型、升级,越是升级,智能化程度越高的这就需要有算力做保障的。我们打一个比方,还是一开始讲的电力,在第二次工业革命开始的时候,城市里有好多马车,当然也出现了电车,这个电车显然比马车效率要高,也清洁。但电车它能够取代马车的一个前提条件是说,你得发得出足够多的电,当你能发得出足够多电的时候,你的城市就升级了,盖楼就可以往高了盖,以前你不敢盖100层楼,因为会爬死,必须要有电梯才能来做这件事。有了电以后,看上去很多产业还是原来的产业,但是它完全进行了一次现代化的升级。

那到今天,比如无人驾驶,他今天做的还不是很好 ,但大家吹得很厉害,觉得前景很好。是因为他提供出一种新的服务,以后不用买车了,根据我们日常工作的时间点,把我们的车自动安排好,后台当然有一些程序来帮我们安排这个。

做无人驾驶这件事它本身也是需要算力的,汽车里头有非常多的处理器,这样才能保证安全行驶。为了保证无人驾驶汽车,他找的是最佳的路线,而且全程他做一个统一的规划,不是一辆车一辆车的优化,让全程的交通时间最短,它需要有一个云计算中心来给他们提供信息,收集他们的信息,给他们做一个实时的指导说往哪去开。这个也需要算力在背后的帮助。

算力对于我们信息时代的作用,有点相当于电对于第二次工业革命时候,就是19世纪末到20世纪初那个时代的一个作用。

提问:把算力和电力的比喻特别清楚,那如果把算力作为一个产业,这个产业的有什么优势和看点?中国的算力产业又有什么特点优势?

吴军:这是个很具体的问题,我举个具体的例子,国内现在最大的云计算公司是阿里云,它涉及到了计算的方方面面,我就拿它做例子讲。

刚才讲了算力比喻成发电,不是说光买了好多发电机组放在那,这个电自然就发出来了。即使电发出来了,你还有一个调度,怎么能够把这个电送达给每一个终端的用户,然后这个终端用户拿到这个电以后,就是虚无缥缈的东西,也不能放我手上——这个算力也是一样,也是个虚无缥缈的东西,还得能够把它用上。

这里至少要做3到4件事,第一个你本身得有足够强的发电能力,这个没有问题。比如说阿里云,它最新的一个超级数据中心或者叫智能数据中心,它提供了一个算力有12EFLOPS。这个概念比较抽象,大家不好理解这个算力有多强。如果大家用最新款的M1的苹果电脑,大概相当于1000万台的苹果电脑它产生的一个算力。

为了提供足够多的算力,他做了三件事。第一件事就是我得把所有的这些提供算力的处理器管理起来,管理好,就像所有的发电机组在一个电网里,你要有效的工作,它这个电网的调配,这是非常重要的一件事,你调配不好,它就互相打架。在计算机上,我们有一个概念叫操作系统,就是云计算它有一个操作系统,它来完成这件事。

第二件事在它的数据中心里,刚才讲了不可能放1000万台的计算机,太耗电了,体积也很大。针对人工智能或者一些特殊的应用,它做了一些优化,可以使得同样耗电量的处理器来处理很多专门的需求,特别是人工智能方面的需求,它的效率提升几倍到几百倍,就是看不同的需求提升的效率不一样。你要提升几百倍,比如原来需要1000万台电脑,它在数据中心现在几十万台大概就能达到同样的效果。

第三件事就是一个网络,我们知道电输出去要有电网,你得建这个电网,这个电网如果电线太窄、太细了是不行的,发电的功率很大,电线太细就烧掉了,所以变电设备所有的这些都要配套。智算中心也是一样,跟网络有关的所有的技术都要做一次升级,使得这个算力能够输出,否则好多机器在发电,接一根很细的电线,往外输电输不出去。

这三件事之后,还有一件事也是很重要的,算力空空的拿在手上,就跟电拿在手上没用,为什么电被接受了?是我们用了一些看得见摸得着的实实在在的电器,比如说最早用的灯泡,爱迪生发明了留声机,我们后来有了电冰箱、彩电、洗衣机等等,电器它能够使得我们的电产生效果。算力这个事,如果能够让我们每个人受益也是一样。

刚才讲的要用无人驾驶汽车,你就得有一个智能的人机接口,就人和计算机的接口,比如说我自己不懂人工智能,但是我用你这个智能接口提供的一个APP,我就直接能够应用好这个算力。刚才说提供算力的公司也要提供相应的应用程序,就这相当于给用户提供灯泡,这是给终端用户。

还有一些算力给企业的,相当于你把电动机卖给企业,但这个企业的电动机一般工人还要有一个学习的过程,提供算力公司,比如像阿里云,他们还要去给企业做一些二次开发,把算力正式用起来。要把这些事做完了以后,这个算力才真正能够惠及到企业,惠及到个人。

提问:既然算力对经济发展这么重要,那我们今天说中国算力去参与全球竞争,这个里面的决定性因素是什么?

吴军:这里大概有几点,我还是用电力来比喻,比如法国的法国的核电发展特别好,它自己用不完,就输出到欧洲其他国家去了,德国缺电,只好向法国买电,这是一个很重要的。比如我们刚刚说到的阿里云,它在全球排第三,但如果和谷歌那个全球最大的智算中心比,它刚刚建的这个比谷歌还打。这相当于我的总发电量虽然没你多,但我新建的发电站已经比你多了,这对国家的竞争力是一件非常好的事情,可以说明竞争力很强。相当于建了个三峡大坝,这是世界上最大的水电站。

第二点是效率问题,比如发同样的电,你家里用了一个白炽灯泡,60瓦的,达到一个亮度,现在你提高了效率,用了一个不到10瓦的白炽灯泡,也有同样的效果。比如算力公司,还是拿阿里云和美国一家做人工智能的叫OpenAI的公司来举例子,他们要训练一个人工智能的模型,取得同样的效果——比如灯泡的亮度,谁需要算力更少,更经济,更节约?我知道阿里云在OpenAI之后做了一些计算底层的改进,结果算力只要美国公司的不到十分之一,很小的一个数量级就达到了同样的亮度。

我讲一个历史的故事,在19世纪80年代,芝加哥的世博会上,世博会想用电灯把晚上都给照亮,就问特斯拉和爱迪生,你们谁能做到这一点,谁能够更有效的来输电。同样发电都没问题,特斯拉也能发,爱迪生也能发,但是特斯拉采用了交流输电,它输电的效率能够做到非常高。爱迪生直流输电,输电的效率比较低,远了就不行,只能在世博会的现场建一个电站才能提供这么多照明的灯。最后的竞争,特斯拉赢了,爱迪生输了。特斯拉一辈子的英明在于交流输电这件事上打败过爱迪生一次,这就涉及到一个效率,你不光能发出这么多的电,最后能够保证同样电让更多的电灯亮起来,就是算力和效率的关系。

第三个是开发的问题,比如说日本在电器时代曾经是世界上的老大,是领头羊。为什么了?因为全世界用的终端电器都是日本的。同样的道理,如果把整个的算力在全世界输出出去,或者说处于一个领跑的地位,在这个上面智能化的APP以及各种工具,各种API的接口,这个要做得好。我们今天在全世界最大的云计算公司,还是亚马逊。亚马逊做得好的主要原因,它的API做得好,就是各种接口做得好,无论是银行系统的,还是保险业、一般的工业生产,包括做媒体的,他提供是非常多。打个比方,甭管买一个什么样的房子,一个小的单件或者一个大的豪宅,他都能给你配上电器。

在这方面中国的算力企业还有很长的路可以走,在云计算的基础上应该会有更多的软件公司和服务公司,他们来参与做APP和API的开发。

提问:那在这三点的前提下,作为中国的算力企业,如果想要在全球竞争中占有一席之地,应该往哪个方向发力呢?

吴军:中国经常说一个词是弯道超车,其实我非常不喜欢这个词,我自己有体验,我自己是开超跑的人,假如你开一个丰田的,我开一个保时捷的911,我一脚油门踩下去,甭管领先多少,一瞬间就超过去了。

刚才讲到了阿里云的超大智算中心,他做这件事很重要,你不要老想着这个小技巧,我就造一个全世界算力最强的数据中心,这个事的意义就很大,我就造一个保时捷出来,就秒杀丰田的这些车,我不用去考虑是不是要弯道,直道就直接超了,这是第一个。

第二个我们刚才讲了好多商业,商业对技术的拉动,我们很多工程师老忽视这一点。我投资那么一家公司,他们要有很大计算量,然后考量了所有的云计算公司,最后发现亚马逊服务做得特别好,提供的APP或者API特别的多。不管你买什么样的房子,我都能给配电器,这点还是非常重要的。我们很多国内企业,商业上还有很长的路要走。

中国云计算企业现在在全球的竞争中,还有两个点可以看一下,第一是我们成本优势,同样造一样东西,从工业的角度来讲,无论是阿里巴巴也好,包括现在的字节跳动,他们做了很多IT基础服务,成本还是比较低的。第二是从地缘上看,亚太有一些新的工业上起步的企业,IT是蛮落后的,比如像越南、印度,这两个国家是不能忽略的。跨国公司比如说亚马逊卖到印度,卖到越南,并不是那么直接,这不是很划算的一件事情;提升他们这些国家的it水平,这个是中国应该做的事情。

我最后要说一下的是算力独立自主的意义,我们老拿电来举例,电网是你自己国家的,最典型的是你看德国被俄罗斯控制,你一旦出点事就很麻烦。你可以把算力的安全和粮食安全、能源安全划等号,你自己需要有发电能力,有电网等等,你自己能够产生算力,能够把算力由网络输入到每一个终端用户。然后你有额外的算力,你可以往全世界来输入,这个你可以理解成粮食安全和能源安全。

标签: #软件技术阿里云计算方向 #阿里云计算方向是学什么