前言:
如今各位老铁们对“internet的万维网的例子”大体比较关心,你们都想要了解一些“internet的万维网的例子”的相关文章。那么小编在网络上网罗了一些关于“internet的万维网的例子””的相关内容,希望看官们能喜欢,你们快快来学习一下吧!互联网与概率有什么关系呢?实际上,互联网是一种巨大的随机网络。随机网络的意思是说,这种网络的顶点数目不固定,顶点之间是否有连线,都是随机变化的。换言之,随机网络的顶点数及连线规则都不是固定不变的,而是以一定的概率出现的随机变量。
随机网络并不限于互联网,还有如今因其而诞生的各种社交网,诸如微信群组、脸书、推特、领英等,甚至可以扩展到一般的社团、教堂、学校等大大小小的人际关系网。在某种意义上,这些都可用随机网络作为数学模型。
下面,我们首先介绍巨大随机网络中的一个有趣现象……
1. 大网络中的小世界
文人们往往感叹世界之宏大,历史之久远,生命之短促,个人之渺小,这些都是不争的事实。不过有时候,诺大世界中意料之外的事也经常发生。比如说在远离故土的国外,你偶然与一个新交往的人聊天,却意外地发现他谈到一个你早年在故乡的同学。这时候,你们两人可能会不约而同地脱口而出:
“啊,这世界还真小!”
世界到底是大还是小?这个世界到底有多大?一类人一类回答:
地理学家说:地球的半径是6370公里,赤道的周长大约四万公里,这就是我们的世界;天文学家说:世界比地球大多了!地球只是宇宙中的沧海一粟。就拿太阳系为例子吧,太阳系的半径大概50个天文单位左右,1个天文单位就大约是1.5亿公里,这个距离,连宇宙最快的光速都要跑8分钟。这还只是太阳系。你说说看,我们的整个宇宙世界有多大?
刚才是科学家们的说法。可是,信佛的人说:佛曰“一人一世界,一树一菩提”。世界吗,自己去理解啦,你觉得它有多大就有多大。
闲话少说,言归正传。我们要问的是:我们的网络世界到底有多大?
谈到网络世界,也得具体指出,是哪一个网络世界?就象大自然到处遍布了各种树木各种森林一样,我们的文明社会也充满了、交织着各种网络:实在的或抽象的、有形的或无形的、技术的或人文的、历史的或现代的。无形的网,诸如社会中的国家之间、社团之间、家庭之间、人际之间的关系网,错综复杂,扑朔迷离。有形的网,诸如电力网、电话网、交通网、运输网,琳琅满目,比比皆是。
如今的互联网,可谓天网恢恢、包罗万象、妇孺皆知、家喻户晓。它将全世界的政治、经济、生活、文化、科学、技术、教育、医疗,每一个方方面面,全部纠结粘连在一起。
除了互联网,还有万维网,它们有何区别呢?简单地说,互联网包括了网络结构、硬件软件、连接方式、传递协议等等多个领域的复杂知识,而万维网所指比较单纯,说的是网页之间的联系,更符合抽象的“网络”的意味。
万维网是网页之间连成的“网”,人与人之间也连成了各种各样大大小小的网,即人际关系网,这类网随处可见,并不依赖于互联网而存在,但互联网却扩展和强化了人际关系网。此外,互联网还将所有关系网连接到一起,形成所谓的“地球村”,地球村中的居民,构成一个巨大的世界范围的“人联网”。
互联网、万维网、及社会中各类人际关系网,有一些共同的特点。本书中我们感兴趣的共同特点有两个:一是它们的网络结构不是固定的,而是不断变化,具有某种随机性。二是在这些巨大的网络世界中,有一个有趣的“小世界现象”!
何谓“小世界现象”?如何来度量网络之大小?让我们慢慢从一般网络的数学模型谈起。
2. 网络和图论
任何网络都可以抽象为一个由许多顶点和连线组成的“图”,十八世纪伟大的瑞士数学家欧拉(Leonhard Euler,1707年-1783年),从研究七桥问题而创造的图论,便成为构造网络世界数学模型最适用的数学工具。
图论中的“图”,是由许多顶点和连线构成的,是顶点与连线的集合。比如,如图6-2-1所示的A、B、C、D、都是图的例子:
必须强调的是:图论只感兴趣于图中的“连线”如何连接“顶点”,也就是说感兴趣于图的拓扑结构,而不感兴趣它们的几何位置及形状。这样,图6-2-1中的A ﹑B﹑及C其实都是等效的图,图D则是另一种类型。总而言之,图的定义初看简单,实际上五花八门,种类颇多。
又如何从具体网络来定义图的连线和顶点呢?对此只能具体情况具体分析。比如,像万维网这样的网络,每一个网页可以看成是一个顶点,网页之间的关系,是否有明显链接?就用点与点之间有没有连线来表示。对人际关系网来说,可以将每个人当作图中的一个顶点,人与人之间的关系,比如:认识或不认识,就构成图中顶点之间的连线。用“图”作为网络模型的方式不是唯一的,视感兴趣研究的对象而定,比如说人际关系网,可以如刚才所说,以个人为顶点,也可以以一个团体(群组)作为顶点,它们的直观区别如图6-2-2所示。
人际关系网可大可小,有各种各样的连接方式,构成各种不同的图。举下面两个简单例子予以说明:考虑一个有200个人的教堂,如果这个教堂的每个人都互相认识,意味着任意两人之间都有1条连线互相到达,在图6-2-3a中画出了6个互相认识的人所构成的图,将其推广到200个顶点的情形便能描述那个教堂。第二个例子是一个100人的小公司,分成部门一和部门二,分别有经理A和B。公司员工之间互相不联络,两个经理A、B互相联络,且分别联络自己部门的所有员工。这种情形的简化版本可用图6-2-3b来描述。
刚才的例子中,图的连线并无方向性。那种网络中人们的关系只是一种简单“互相认识”的关系。如此而构成的图,称之为简单图。网络图可以有方向,比如我们考虑“我认识奥巴马,奥巴马不认识我”之类的情况的话,就得在网络图的连线上画上单向或双向的箭头,这样构成的图,称之为有向图。
虚拟网络世界的人际关联网,诸如微信、电邮、脸书、推特等等,所对应的是具有成万上亿个顶点和连线的巨大的‘图’,这种图已经与二百多年前欧拉所研究的图有了本质的区别:这些巨大的图是随机的、统计的、算法的。举万维网为例,刚才说过,可以把万维网中的每个网页看作是图的顶点,网页之间的链接作为图的连线。那么,根据2016年的资料,万维网所构成的图有超过140亿个顶点和几十亿条连线。并且,图的顶点和连线都不是固定的,而是每时每刻都在随机变化着,微信等社交网络连成的人际关联网也是如此。
3. 网络的大小
网络的大小也就是所对应的图的大小。在图论中,有好几个术语与图的大小有关,比如其中之一为“阶”(order),指的是图的顶点数;另一个是“尺寸”(size),指的是图的连线数。我们感兴趣的是另一个术语“图的直径”。
几何中,用点和点之间的最大距离,也就是直径,来描述几何体的大小。我们用图论中的“直径”来衡量网络世界的大小。简单地说,图论中两个顶点之间的距离被定义为其间最短路径所经过的连线的数目,而直径则与几何中类似地被定义为所有顶点间的最大距离。
图6-3-1用两个简单例子来直观说明“图的直径”。
图6-3-1a的图有5个顶点10根连线,每个点到其它任何点都只需要1步,由此而得该图直径=1。图6-3-1b的图有5个顶点5根连线,每个点到其它任何点都需要2步,因此该图直径=2。
图论中的直径概念,在人际关系的实例中,可以如此描述:人际关系网的大小,定义为任意两个人之间,最多要经过多少个关系(连线数),才能互相到达。比如,图6-2-3a所示200个人的教堂,每个人都互相认识,意味着任意两人之间都有1条连线互相到达。因此,这个教堂人际关系网的“直径”是1。而图6-2-3b中100人公司的情形下,在每个部门内部,员工之间没有直接连线,需要通过自己的部门经理而互相到达,也就是要经过2条连线。而部门一的员工C,要到达部门二的员工D,则需通过3层关系:C<->A,A<->B,B<->D,三条连线。因此,这个公司人际关系网的“直径”是3。
从刚才的几个例子不难看出,如此所定义的图的大小,并不等同于顶点数和连线数。图6-3-1b的网络比6-3-1a的网络连线数更少,直径却更大。人际关系网的大小,也与网的人数无关。从人数来看,200人的教堂大于100人的公司,而从直径大小看,公司网络的直径为3,大于教堂的网络直径1。所以,关系网的直径所度量的,不是人的多少,而是人与人之间关系紧密的程度,连接越紧密,直径越小。
对巨大又复杂的随机网络,诸如万维网、微信网这些大网所对应的巨图,我们仍然可以用与刚才类似的方式来定义它的直径(大小)。只不过,现在的数学量都应该是统计意义上的,所以,任何量的前面,都应隐含地冠以“平均”二字。比如以万维网为例,我们说:万维网的大小(直径)定义为从一个网页到另外任意一个网页,鼠标最多需要点击次数的平均值。
那么,遍布地球,超过140亿个顶点和几十亿条连线的万维网的直径是多大呢?你恐怕会猜测它是一个天文数字。
出人意料的是,万维网的直径并非如万维网的网页数目那样巨大,而是大约等于19。这个值的意思是说:从万维网的一个网頁,要連到任意另一个网頁,平均最多需按19次鼠标。从140亿到19,这便是大网络中的小世界现象!最早由美国微软研究者邓肯·瓦茨(Duncan Watts,1971年-)和美国数学家斯蒂文·斯特罗加茨(Steven Strogatz,1959年-)在1998年提出。
(摘自《从掷骰子到阿尔法狗:趣谈概率》,作者:张天蓉)