携手共进
创造美好未来

网络模型有哪些,数据模型及结构详解?

三十年河东,三十年河西。”是一句广泛流传的谚语,经常被用来形容世事盛衰兴替,感叹世事变化无常。现在我们用来说一个人的处境发生了很大的翻转式变化,一个地区发生了巨大的超出想象的发展或衰落。

这类人和事见多了之后,在感慨之余,你很容易就会联想到一件事,为什么会这样?有没有一种隐形的力量一直决定着个人、公司、城市和国家的持续发展?

如果你关注一下近三十年全球市值排名前十的公司的变化,很容易就会发现一个秘密:截止2019年,市值排名前十的公司里有7家都是互联网公司。

那到底是什么力量决定了这些公司能够在这么短的时间之内,从默默无闻一跃成为世界之巅峰呢?

答案是:网络

网络无处不在。人们经常会谈起贸易网络、人际关系网络、恐怖主义网络,以及志愿者网络。不同物种还会组织成食物链,那是一种网络形式;上下游企业会建立供应链,那也是一种网络;不同的人群会在虚拟空间加入不同的社群,那还是一种网络。

如果要对网络有个更直观、更深刻的理解,下面这个小故事也许会对你有所启发。

曾经有这样的一个故事:

一对父子,大鱼和小鱼,父亲是鱼类的哲学家,非常爱思考。有一天父子俩在一起聊天,大鱼就问小鱼,什么东西对鱼才是最重要的呀? 小鱼回答说,我觉得最重要的就是食物了,鱼以食为天嘛。大鱼说不对,对鱼来说最重要的是水。 小鱼很困惑,就问道,水是什么呀? 大鱼竟无言以对。

要说近几百年,哪一项发现是最伟大的,大部分人都很难一下子给出答案,因为有很多。文艺复兴、地理大发现、DNA双螺旋结构、青霉素、蒸汽机、电等。。。但如果要说,哪项发现是对我们的生活工作影响力最大,且以后将一直影响我们每一个人的发现是什么?

我想那一定是,网络。

这个时候,会不会有人跟小鱼一样疑惑网络到底是什么?其实,生活中我们对网络的理解跟那条小鱼是一样的。我们的本能在时刻影响着我们,很多习以为常的事物都被我们忽略了。直到近二十年,互联网经济发展迅猛,很多人才把互联网思维拿出来到处兜售。

生活中,常有人会有这样的感觉,总是觉得自己的朋友比自己在社交圈中更受欢迎。

可能你还听说过这个世界很小,小到普通人只需通过6个人的转介绍就可以联系上特朗普这样远在天边的人。

互联网创业者们一定深知赢家通吃的道理,这就是为什么普通人刚开始难以看懂滴滴、美团这样的互联网公司真敢数亿烧钱补贴获取用户的真相。

微信这样的产品是无法被一个新的即时通讯工具打败,有没有什么科学依据?

很多教授专家在抖音上的粉丝数和影响力远不及很多网红博主,而且细心的你甚至还发现那些网红们说的很多都是错的,但这丝毫不影响他们的粉丝数量持续增长。

今天,我就来跟大家一起深入了解一下网络模型,对网络模型进行全面研究,需要写好多本书。因此在本篇文章,我们只专注于一个更加简单的目标:了解有关网络的基础知识,并讨论它们的重要性以及一些网络模型的主要应用场景。

一、 网络的三大基本结构

网络由节点以及连接节点的边组成。由边连接起来的节点互为邻居。在描述网络结构的量中,度、路径长度和聚类系数这三个概念最为重要。

度:节点的邻居数(即边数)。

路径长度:从一个节点到另一个节点必须遍历的最小边数。

聚类系数:一个节点的邻居对当中,同样也由一条边连接的邻居对所占的百分比。

1、度是其中最基本的一个概念。网络中存在节点,节点之间的连线表示连边。对于表示人和人之间朋友关系的社交网络,每个点代表一个人,节点之间的连边表示朋友关系。一个节点的度,就表示这个节点的连边数。在社交网络中,节点的度表示一个人的朋友数目。

网络中不同节点的度可以完全一样,也可以差异很大。因此,度的分布可以帮助我们从网络结构角度认识不同类型的网络。

2、路径长度,指两个节点之间的最小距离(最小边数),在数学上与度成反比。

例如:在航空公司的航线网络中,路径长度对应于人们从航线网络中的某个城市到另一个城市所需的航班数量。如果要在两家航空公司之间做出选择,在其他所有条件(即价格)都相同的情况下,旅客会更喜欢平均路径长度更低的那家航空公司。

3、聚类系数刻画了节点的邻居之间的连边密度。以社会网络为例,对于一个拥有 10 个朋友的人而言,他的朋友之间最多可以形成 45 条边,那么如果他的朋友之间实际连边数为 15,则我们说这个人的聚类系数为 15/45=1/3,如果他的朋友之间彼此都相互认识,聚类系数为1。同样,如果他的朋友恰好彼此都不认识,那么聚类系数就是 0。

以上三个网络的基本结构只是网络结构的一些统计量,并不能唯一确定一个网络。譬如:度分布相同的网络在结构上可以相差很大,实际上,平均度为 2、节点数为 10 的不同网络可以高达数十亿个。因此,为了更好地刻画网络结构,仅仅使用这些量是不够的,我们还需要网络模型。

二、 常见的三个重要网络模型

1、随机网络

随机网络是指通过随机连接节点搭建起来的网络。在随机网络中,链接是完全随机放置的,所有节点有相等的机会获得链接。只要网络足够大,几乎所有节点拥有的链接数都基本相同。因此,随机网络是一个高度平等的网络。

随机网络的启示:每个人只需认识一个人,就能形成社会。

每个人都是遍及全世界的社会网大节点簇的一部分,没有人能游离在外。没有人能够认识地球上其他所有人,但是,在人类社会网络中,任意两个人之间一定有一条路径。

类似地,我们大脑中的任意两个神经元之间、世界上任意两个公司之间、我们体内的任意两种化学元素之间都存在可达路径。任何事物都无法脱离这个高度互联的生命网络而独立存在。

保罗·埃尔德什和阿尔弗雷德·莱利告诉了我们这背后的原因:每个节点只需要一个链接就可以使它和整个网络保持连接。这意味着,要和网络中的其他成员保持连接,每个人只需要认识一个人,大脑中的每个神经元和其他神经元之间只需有一条链接,我们体内的每种化学元素只需具备参与至少一个化学反应的能力,商业世界中的每个公司只需和至少一个其他公司建立贸易关系。

2、小世界网络

无论是找工作、获取消息、开餐馆,还是传播新潮流,弱关系在我们和外部世界互通消息方面发挥着至关重要的作用。弱关系,是我们连接外部世界的桥梁。然而,聚团现象无处不在,它已经从社会的独特性质迅速提升为复杂网络的普遍性质。

网络“小世界”网络是一类特殊的复杂网络结构,在这种网络中,大部分节点彼此并不相连,但节点之间经过少数几步就可到达。

网络中的聚类性是指在网络中,同一个顶点的邻点之间有更大的概率有边连接的现象,简单来说,就是我们的密友之间往往也是朋友。

它是复杂网络的一个重要特性,源于小世界网络模型,通常都用“聚类系数“来衡量。聚类系数能够说明你朋友圈的连接紧密程度。如果聚类系数接近1,则你所有的朋友之间也是朋友;如果聚类系数是0,那你便是将你的朋友圈连在一起的唯一的人,他们彼此不认识。

3、幂率网络

幂律分布是一种常见的统计现象。具有幂律分布的数据,表现为一条斜率为幂指数的负数的线。(关于幂律分布,具体可参照2021.6.12老范的推文“幂律分布——强者恒强、弱者愈弱”)

对互联网来说,幂律分布具有特殊的意义。因为互联网中一些核心的现象,都与它有关。幂律分布不仅在技术现象中体现出来,而且在经济现象中体现出来。因此理解幂律分布,对于深入把握互联网特征,具有技术与经济、理论和实践双重意义。符合幂律分布特征的网络就是幂律网络。

三、 网络模型的三大法则

1、六度分割法则

六度分隔是指平均来说,社会网络中任意两个素不相识的人之间,最多只需经过六步即可建立相互联系。也就是说,最多通过六个人你就能够认识任何一个陌生人。并不是说任何人与人之间的联系都必须要通过六个层次才会产生联系,而是表达了这样一个重要的概念:任何两位素不相识的人之间,通过一定的联系方式,总能够产生必然联系或关系。

弱连接对一个人拓展事业或开展新生活非常重要

一个人的三度人脉(朋友的朋友的朋友)会比二度人脉(朋友的朋友)多得多。三度朋友可能是相当重要的,如果你有100个可以经常直接联系的圈内朋友,那么三度朋友人数的理论值能高达25万。

与一个人的“圈内好友”不同,一个人的三度朋友往往会住在不同的城市,就读于不同的学校,拥有不同的信息,他们会更加多样性。他们也足够接近,可以建立起信任关系:

朋友的朋友的朋友可能是你的室友的母亲的同事,或者是你妹妹的男朋友的姨妈。三度朋友的数量很重要,他们的多样性以及相对接近性使他们成了你的重要资产,他们可以提供新的信息和工作机会。这些人最有可能帮助你找到工作,促使你搬到新的城市,或者成为生活中、商业上的伙伴。

2、无标度网络法则

无标度网络是遵循幂律度分布的网络。网络中大多数节点只有很少几个链接,它们通过少数几个高度连接的枢纽节点连接在一起。在形状上,无标度网络很像航空交通系统,很多小机场通过少数几个主要的交通枢纽连接在一起。

无标度网络模型区别于随机网络模型和小世界网络模型的根本之处有两点:生长机制和偏好连接。生长机制和偏好连接是支配无标度网络的两大定律。

网络模型有哪些,数据模型及结构详解?

生长机制:无标度网络模型认为网络的节点数目不是固定不变的,网络是不断生长的,节点是逐个加入到网络中的;

偏好连接:新加入的节点优先和度大的节点进行连接。正是这样两个看似很简单的机制,保证了幂律度分布的产生。

3、富者越富法则

它指在现实的网络中,连接模式并不是随机的,新的节点倾向于与已经有高度连接的节点相连。这也解释了为什么我们会有枢纽点产生于各种不同类型的系统,同时也完全深受生长机制和偏好连接的支配。

短视频平台的流量和粉丝关注度都会向头部网红大V集中的主要原因。在网络中,先发优势和先发影响力非常重要。而微信在即时通讯工具领域的无可撼动性,抖音快手在短视频分发领域的不可替代性,以及Tiktok在全球的风靡都归功于富者越富法则。

网络效应:

当一种产品对用户的价值随着采用相同产品或可兼容产品的用户增加而增大时,即出现了网络外部性。也就是“网络效应”。在学术上,关于网络外部性和网络效应拥有不同的解释,便于理解方便,本篇文章所说的网络外部性就是指网络效应。

例如:微信用的人越多,对你越有好处,因为你只要下载一个微信,就可以和很多朋友进行联系。试想一下如果你身边的人,每个人都用一个不同的社交软件,这就大大地增加了沟通成本。网络外部性,也叫做需求方规模经济。需求方规模经济对应的是供应方规模经济,我们先来了解一下供应方规模经济。供应方的规模经济就是生产方规模化生产,它可以让产品的单价下降,从而惠及消费者。

例如:一辆汽车的研发成本为5亿美金,量产1000辆和量产10万辆的价格肯定不一样,所以量产数越大,单位成本越低,零售价格也越低。比如大众桑塔纳,在华累积销量达到了540多万辆,研发成本早已收回,除了制造成本和营销成本之外,剩下的就是利润。什么是需求方规模经济呢?需求方规模经济就是随着使用产品的需求方越来越多,从而给单个使用者带来额外的价值。

假如你是第一个使用微信的用户,后来者使用微信的人越多,对你越方便。这种网络外部性或“网络效应”对网络用户可以带来两部分的价值,一个部分叫做“自有价值”,是在没有别的使用者的情况下,产品本身所具有的那部分价值。有时这部分价值非常低甚至为零。例如你下载微信软件,当没用户使用的情况下,价值基本为零。另一部分价值叫做“协同价值”,就是当新的用户加入网络时,老用户从中获得的额外价值,而用户是无须为这部分协同价值付费的,这部分“协同价值”就是网络外部性的经济本质。网络效应的核心就是协同价值。

著名的梅特卡夫定律认为,网络的价值以网络节点数平方的速度增长。也就是网络的价值等于网络节点数的平方。

例如:一个网络对网络中每个人的价值为1美元,那么规模为10倍的网络的总价值约为100美元,规模为100倍的网络总价值约为10000美元。网络规模增长10倍,其价值就增长100倍。这一法则的本质就是网络外部性。

当然,根据网络科学领军人物巴拉巴西的网络科学理论,网络模型的重要法则还很多,比如:阿喀琉斯之踵法则(即随机的崩溃不会让系统崩溃,但是如果你把重要节点移除掉,系统马上会变得支离破碎)、枢纽法则(系统的枢纽点会从根本上改变该系统的行为)、群体法则(一组节点内部之间的联系比它们与群体外部节点之间的联系更多)。

总结:

现实世界的网络在度分布上和无标度网络接近、在聚类系数上和小世界网络类似,呈现出“局部聚集、整体分层”的结构特征,这样的结构最大限度下保障了网络的鲁棒性。

在这样的网络结构中,人们津津乐道的弱连接现象自然而然就出现了,弱连接是指那些出圈的连接。例如:你是一个律师,如果你乘坐航班时认识了一位设计师或是一位投资人,你们之间的连接就是弱连接。弱连接看上去总是那么地随机,那么的不可靠。但是,从网络结构上讲,正是这些弱连接让我们拥有了圈外的朋友,使我们朋友的朋友在数量上可以十分庞大,极大地拓展了我们的交际和多样性信息获取能力。

大千世界形形色色的网络,他们所描述的对象千差万别、在历史长河中出现的早晚相差甚远,然而这些网络却在结构上和有很多相似之处。究竟为什么会这样?这个问题一直是网络科学孜孜不倦要努力回答的,网络模型就是为了回答这些问题的钥匙。

企业的指数级增长,“三十年河东,三十年河西”现象,社交网络的繁荣,网络效应下赢家通吃的局面,人和组织的持续成功,这一切的背后都是网络这只看不见的大手在自发推动。

如果不知道如何深刻认知网络,我们可以转向大自然,向大自然去学习。

从宏观来看,星罗棋布的万千溪流在广袤的大地上,最终汇入大海,万折必东;

从微观来看,数不胜数的毛细血管在复杂的人体里,最终连接人体,运输血液。

每个时代都是由看得见的精英和无数的看不见的个体共同创造出来的,如果无法直观感受网络的力量,那就仰望头顶的星空吧,你既是无限宇宙的沧海一粟,又是这个宇宙中不可或缺的唯一存在,所有可能性都寄歇与此。

我们组成网络,我们自身就是网络。

版权声明:本站资源及文章图片来自互联网及其他公众平台,版权归原作者,如有侵权请联系我们删除!
文章链接:http://www.rujiaoqi1.com/100884.html