复杂网络的微信网络信息传播研究
第14卷第17期2014年6月1671—1815(2014)17-0244-04
科学技术与工程
Science Technology and Engineering
Vol. 14No. 17Jun.2014 2014Sci. Tech. Engrg.
复杂网络的微信网络信息传播研究
张
宏
1,2
李杰
1%
(华中科技大学1,武汉430074;武汉理工大学华夏学院2,武汉430223)
近三年,微信迅速发展成为最热门的社交平台。通过对微信网络的基本数据描述和复杂网络分析方法,对微信网络
结构拓扑性质进行了分析。构建腾讯微信社交网络,得到度分布、聚集系数、平均路径长度等复杂网络统计性质,得出了微信摘
要
网络的无标度特性和小世界特性,为研究信息在微信中的传播性质,对腾讯微信数据进行实证分析,结合实际案例,评价了微信网络拓扑结构对网络信息传播的影响。关键词
复杂网络微信
中图法分类号TP393;
网络结构分析文献标志码
A
信息传播
1复杂网络与微信的发展
如果将系统内各个元素作为节点,元素之间的联系视为连接,那么整个系统就构成了一个网络,例如计算机网络可以看成是计算机通过光缆、双绞线等互相连接形成的网络。真实世界存在着大量复杂系统,都可以通过网络来进行描述。这些抽象出来的真实网络的拓扑结构节点众多,称为复杂网络(complex networks )。20世纪50年代末,Paul Erdos 和Alfred Renyi提出了一种完全随机的网络模型,但仍不能很好地刻画实际网络的性质,人们又提出了小世界网络和无标度网络。对于微信网络的拓扑结构,学者也需从小世界和无标度两个方面进行研究,用平均路径长度(the average path length )、聚集系数(the clustering coefficient )、度分布(the degree distribution )、介数(betweenness )等考查复杂网络的动力学行为。根据现有复杂网络研究成果:度大的节点介数不一定大,度小的节点介数也不一定小。许多学者认为,网络传播中最具影响力的节点是具有更多连接的节点(hubs ),往往也是高介数节点,
[1]
但也有些学者反对这种说法。另一类学者(如Husdal ,Bell ,Jenelius )则将事件的后果与概率联系起来,同时考虑事件传播的概率和传播所产生的后果,可以用计算风险的方法来表示。如图1所示,概率大和后果严重的第Ⅲ象限事件舆情传播危害最大,概率小和后果小的第Ⅰ象限危害最小
。
2014年1月9日收到第一作者简介:张
%
Fig. 1
图1概率-后果矩阵示意图
Probability-consequences matrix diagram
近三年,最热门的互联网社交平台应用当属微信网络。2011年1月21日,微信发布针对Iphone 用户的1. 0测试版,仅有即时通讯、分享照片等简单功能,在随后的三个测试版本中,微信逐渐增加了对手机通讯录的读取、与腾讯微博私信的互通以及支持多人会话功能,到2013年9月,微信5. 0. 1上线,微信用户数量即将突破4亿,短短的两年半时间内,微信团队的免费策略使得用户“野蛮”增长,让运营商们望尘莫及,发展成为中国网民的重要应用之一。
微信从最初的简单功能,已经发展到支持实时对
“摇-、、支持对摇”二维码扫描、讲、多人实时语音聊天
聊天记录进行搜索、保存和迁移,语音提醒和根据对方发来的位置进行导航等功能,微信用户多样性、内容复杂性、信息传播快捷性一起构成了独特的微信复杂网络,人们对微信这一新兴产物的研究比较少。
国家自然科学基金项目(51078165)资助
2
2. 1
网络构建与拓扑性质
宏(1981—),女,博士研究生。研究方向:复杂杰(1954—),男,教授。研究方向:复杂网络,
mail :zhang2001hong@126. com 。网络、网络脆弱性。E-通信作者简介:李
mail :whpuxb302@sina. com 。交通工程。E-
微信网络的基本数据和描述
[2,3]
,在微复杂网络中最基本的元素是点和线
点代表微信平台上的用户,线代表用信社交网络中,
表示节点之间的关系,这种关系是微户之间的联系,
QQ 好友或“摇-信用户之间通过通信录、摇”加为好友来表示的,点和线构成无向非加权网络,即节点之间的关系是双向的,无向网络中不区分节点之间的
N E ),长短。微信社交网络可以抽象为网络G (N ,
E 为用户之间的连接。表示社交网络中用户集合,
B 、C 、D 、E 、F 代表6个微信用户,假设用A 、用上面
说明的方法构建微信网络基本要素的节点和关系,建立微信网络,他们之间的关系如图2所示,网络中的节点表示微信用户,节点的位置不固定,关系表示用户之间是否加为好友,这样的无向网络可以用邻
如果i 和j 之间相连,a ij =接矩阵A =(a ij )表示,
1,各节点自身的关系用0表示,由此得否则a ij =0,
到的微信网络为无向非加权网络,这种无向性使得邻接矩阵为对称矩阵,因此微信网络可以表示为一个对角线为0的对称二维关系矩阵
。
〈C 〉用表示。
C i =
2E i
;0<C i ≤1
k i (k i -1)C i ∑i ∈G
N
(1)
〈C i 〉=(2)
节点的聚集系数反映了相应节在微信网络中,
点的邻接节点间联系的疏密程度,例如明星微信或公众号微信的聚集系数高表示公众关注的程度高。聚集系数的平均值则反映了整个微信网络中所有节点间联系的疏密程度。
参数3:平均路径长度。
网络中两个节点i 和j 之间的距离d ij 定义为连接两个节点的最短路径上的边数。网络的直径为任
D =max d ij 。网络平意两点间的最大距离,记为D ,
均路径长度L 为所有节点对之间距离的平均值:
2
L =d ij (3)∑N (N -1)i ,j ∈G ,i ≠j 研究发现,绝大多数大规模真实网络的平均路径长度比想象的小得多,称之为“小世界(small
[5]
world )效应”。
3
3. 1
图2微信网络用户关系示意图
Wechat network for users and the relationship
微信网络信息传播实证分析
Fig. 2
微信网络的拓扑结构特性
无向非加权网络的基本统计参数有度分布、聚
[4]
平均路径长度等。下面对微信网络的这集系数、
些统计性质进行简要的分析。
参数1:度分布。
节点的度k 表示与此节点连接的边的数目,所
〈k 〉有节点的度的平均值称为网络平均度,用表示,
〈k 〉=p (N -1)≈pN 。网络中节点的度分布用概率分布函数p (k )表示,其含义为一个任意选择的节点恰好有k 条边的概率,也等于网络中度数为k 的节点的个数占网络节点总个数的比值。如果节点度分布
-γ
遵循幂律分布,即p (k )∝k ,当N 很大时,节点度
k
e -〈k 〉〈k 〉
,分布近似为泊松分布:p (k )≈幂律分布k !
图形没有峰值,说明大多数节点仅有少量连接,而少量节点拥有大量连接,不存在随机网络中的特征标
free )网络。度,称为无标度(scale-参数2:聚集系数。
节点i 的聚集系数C i 表示它所有相邻节点之间实际存在的边数与可能的最大连接边数目之比,所有节点的聚集系数的平均值称为网络的聚集系数,
2. 2
基于腾讯微信的社交网络构建由于微信才刚刚兴起,即使部分微信公众平台提供了应用程序接口,但对调用程序有限制,具体数据的获得难度较大,本文所取得的数据通过JAVA 编程实现,从原始节点出发,在下层节点中随机选取20个节点,以此类推,获得500个不重复的节点,目的是防止个别节点好友数目众多而降低分析有效性,用获得的这些节点构造微信社交网络。在这个社交网络中,通过判断每个微信账号之间的关系获得连线,构造a ij 邻接对称矩阵。用e =m /N代表连接数目m 和用户数目N 之比。构造不同的N 值。研究
e 值都介于1 2之间。发现,在规则网络中,例如网
e =1;而随机网络e =格状结构或树状结构网络中,
(N -1)/2。有研究表明:随机ER图e >15/7。图3代表在不同样本量下e 值范围,都介于斜率为1和2的两条直线之间。微信社交网络e 值介于1和2之间,表明微信网络不同于规则网络和随机网络,有其自身的特性。
3. 2基于复杂网络的微信网络分析3. 2. 1度分布[6]
在微信网络中,用x 表示节点的度数,用f (x )表
b 为示节点数,引入函数模型f (x )=a +bx ,式中a 、
b 可通过实验生成数据利用回归系数,模型中的a 、
最小二乘法得到。通过筛选去除不合理的数据,模型
Fig. 3
图3不同样本量下e 值范围图
e value range under different sample scale
根据幂律分布函数求解结果为f (x )=9. 7-0. 4x 。
p (k )∝k -γ,进行变形,可以得到度分两边取对数,
布方程。一个分布形为幂函数的分布,它的函数图象很直观,用双对数坐标表示出来的时候是直线,从方程可以看出,微信网络具有幂律分布特性,幂律指数的大小代表了通过微信进行社交的活跃程度,这意味着微信网络中新加入朋友和已有微信朋友的连接可视为随机连接。图4所示为某明星微信与某普通群众微信的累积度分布,从图4可以看出,明星微信的朋友更多,微信网络更活跃
。
径。微信用户之间平均通过3个用户就能与任意其
他用户相连。相同规模的随机网络平均路径长度L =2. 16,与微信网络平均路径长度差不多。随着网络规模不断增加,平均最短路径长度会随之增加,虽然微信用户数量暂时不及微博用户,但与其网络规模的对数近似一致,仍表现出较短的平均最短路径。3. 2. 4小世界特性的判定
根据Watts 和Strogatz 分析,判定一个网络是否是具有小世界特性,可以将其平均路径长度L 、平均聚集系数〈C 〉与同规模的ER随机图的值L rand 、〈C rand 〉进行比较,当满足式(4)和式(5)时,即为小世界网络。
ln N
(4)L ≥L rand =
ln 〈k 〉
〈C 〉>>〈C rand 〉=3. 2. 5
〈k 〉
N
(5)
无标度网络特性的判定
通过微信网络度分布函数是否为幂律形式判断其是否具有无标度特性。当度分布为幂律分布时,
P k ∝∑k ' -γ∝k -(γ-1)
k ' =k ɕ
累计度分布函数
(6)
P (k ' )∑k =k
'
ɕ
式(6)中累计度分布函数P k =表示度大于
图4双对数坐标下累积度分布
Fig. 4Degree cumulative distribution
fitting in log-log plot
聚集系数
通过matlab 编程计算得到微信网络平均聚集〈C 〉=0. 245,系数通过构造相同规模符合泊松分布的随机网络,设其密度为0. 05,与微信网络的密度相同,对其进行分析,可以得到该随机网络聚类系数为0. 05,远远小于微信网络0. 245的水平;由此可见,微信网络具有较大的聚集系数,你的朋友之间很可能也互为朋友。
3. 2. 3平均最短路径长度
对关系矩阵分析,可以得到节点路径分布,通过上述公式可以计算微信网络平均路径长度L =2. 45,对于庞大的微信网络来说,具有较小的平均最短路
3. 2. 2
等于k 的节点的概率分布。所以通过绘制累计分布
曲线也可以判断微信网络拓扑结构的无标度特性。3. 3案例数据及分析
2013年春晚刘谦魔术节目,中搜搜悦第一时间在微信公众账号发布刘谦魔术揭秘文章,并在微信群和公众平台进行推广。各大公众账号及网友对该文章进行转发及分享,次数达到10万以上。迎合微信用户的好奇心理,第一时间推送观众迫切需求的新闻猛料,满足用户的诉求;另外,搜悦用户还可以去搜索、订阅自己关注的人物、事件或产品。刘谦魔术的相关猜测和评论在微信上得到广泛传播,本文重点探讨众多微信用户所构成的社交网络对信息传播的影响。由图5所示,对刘谦魔术的关注随着时间演变的过程。2013年2月10日在春晚舞台上表
2演完节目之后就第一时间在微信上引发了大猜想,
月11日上午,有关网站纷纷出现了刘谦蛇年春晚魔术揭秘等关键词,关注此事件的微信大量转发、分享和传播,在2月12日,当天转发及分享次数达到了3万次以上,随后的两天虽然有所回落,但转发、分享数量依然惊人。
从微信社交网络的无标度特征可以推断微信信息传播存在蝴蝶效应,在人数较多的微信公众平台
网络的进一步研究提供参考。国内外研究人员已经
提出许多关于衡量网络中心点中心性的方法,目前尚未得到统一的结论。
4结论
Fig. 5
图5信息网络传播
Information network spreading
结合复杂网络研究了微信网络拓扑性质,采用复杂网络方法对微信网络进行描述,分析了微信网络拓扑结构特性。应用实例表明:微信网络具有无标度和小世界特征,为发现微信网络形成,认识其发展过程以及信息传播路径和方式提供有价值的参考。下一步将对微信复杂网络的更多特性进行研究,并和其他社交平台进行对比。目前的复杂网络特性描述实际网络还存在着差异,即使具有两种特性也不能很好地逼近现实。
参
1
上或明星微信号上,一条简单的微信可以引发众多
甚至形成社会舆论,微信用户的讨论、转发与分享,
传播过程更是爆炸性的。从图5很明显可以看出,仅仅一天时间有关刘谦魔术揭秘的微信传播呈现出爆炸式增长,这也说明在微信无标度网络中信息传播平均路径非常短。网络传播行为最初仅分析疾病传播现象,发展到现在,可以用复杂网络分析许多事物的传播行为。例如我们可以将其应用于社交网络上传播行为的研究:首先从复杂网络出发抽象出社交网络拓扑结构,构建网络图,分析基本拓扑性质,按照一定规则分析其传播机制,最后研究采取何种措施影响这种传播。实际上,这类研究工作在微信上正在开展,如知识和技术的扩散、网络新产品扩散等应促进传播,如计算机病毒在计算机网络上的蔓延、谣言扩散等应避免传播。集中性或节点中心性用来衡量微信中的某一节点在网络中处于什么样的地位,信息在整个复杂网络中传播有怎样的影响力,可以通过节点介数来说明,介数反映了相应的节点或者边在整个网络中的作用和影响力,具有很强的现实意义。虽然目前用复杂网络理论研究微信尚未出现,但关于微博网络中心性研究从微博出现就已经开始了,可以对微信
考文献
Palla G ,Derenyi I ,Farkas I ,et al . Uncovering the overlapping com-munity structure of complex networks in nature and society. Nature ,2005;435(7043):814—818
2Costa L D ,RodriguesF A ,Travieso G ,et al . Characterization of complex networks :a survey of measurements. Advances in Physics ,2007;56(1):167—242
3金
斌,朱建明. 基于复杂网络分析的微博网络舆情传
播. 吉林大学学报(工学版). 2012;(S1):271—275Jin X ,Xie B ,Zhu J M. Micro-blog network public opinion diffusion
鑫,谢
based on complex network analysis. Journal ofJinlin University (Engi-neering and Technology Edition ),2012;(S1):271—275
4Zakharov P. Diffusion approach for community discovering within the complex networks :live Journal study. Physics A :Statistical Mechan-ics and its Applications ,2007;378(2):550—560
5Paul G ,Tanizawa T ,Havlin S ,et al . Optimization of robustness of complex networks. The European Physical Journal B-Condensed Mat-ter and Complex Systems ,2005;48(1):149—149
6徐胡海波,
玲,王科,等. 大型在线社会网络结构分析. 上海
2009;43(4):587—591交通大学学报,
Social Network. Journal of Shanghai Jiaotong University ,2009;43(4):587—591
Hu H B ,Xu L ,Wang K ,et al . Structural Analysis of Large On-line
Study on Wechat Network Information Flow Based on Complex Network
2
ZHANG Hong 1,,LI Jie 1%
(Huazhong University of Science and Technology 1,Wuhan 430074,P. R.China ;Wuhan University of Technology Huaxia Collegy 2,Wuhan 430223,P. R.China )
[Abstract ]Recentlywechat has become the most popular social network platform. Using complex network theo-ry ,the features of wechat network topology were analyzed. Tencent wechat social network was built ,the statistical
properties of complex network were analyzed based on the degree distribution ,the clustering coefficient and the av-erage path length and find that the network has scale-free and small world features. Finally ,the influences of we-chat network topology structure on the information diffusion were analyzed combining with the actual network event case in order to study the features of wechat information flow. [Key words ]complex network wechat network structure analysis information transmission