高等教育研究高被引论文作者互引网络分析
2012年第8期
No. 8,2012
EDUCATIONAL RESEARCH
General ,No.
391
(总第391期)
高等教育研究高被引论文作者互引网络分析*
高耀明李
[摘
莉寇琳娜
要]以高等教育研究领域50位作者505篇高被引论文为研究对象,从整体特
征、子群特征和显著性三方面分析作者互引网络研究发现,互引网络呈现了类似幂律分布的特征;网络紧凑性不高,不存在密度特别高的区域和明显的社群结构;信息与知识的相互流动以间接为主,学术流派尚未形成,高水平研究人员研究之间的继承和发展联系不明显。可见,高等教育学还不是一个围绕共同规范建构而成的学术共同体,学科发展尚处于前科学阶段。
[关键词]高等教育研究;高被引论文作者;互引网络;网络分析
[作者简介]高耀明,上海师范大学教育学院教育管理系系主任、教授、博士;李莉,上海师范大学教育学院教育管理系副教授;寇琳娜,上海师范大学教育学院教育管理系硕士生(上海200234)
的成熟度,了解学者的影响力等,为我们把握学科
一、引言
高等教育学创立于1979年前后,经过30多年建设,无论从研究成果的数量和影响力看,还是以研究队伍的人数衡量,它已成长为教育学学科体系中最重要的二级学科之一。高等教育学作为一个学科研究领域,研究者的研究工作是相互影响和联系的。从量化研究的要求看,研究者相互引用是观测这种影响和联系的指标之一。“引文可视为科学家非正式交流的社会结构,也可显示科学
[1]家之间的合作组织结构。”由相互引用所构成
发展态势和考察研究者群体互动提供实证指标。社会网络分析作为一种社会结构分析策略,“在近一二十年迅速发展成为了学术界的一个热点领
[2]域,并得到了广泛的应用”。有学者认为,社会
网络分析也是研究引证关系和引文网络的有力工
[3]具。近年来,一些研究者尝试将社会网络分析
应用于某一学科领域的期刊或研究者之间互引关系分析。例如,有学者运用社会网络分析方法分
[4]析了34种管理学期刊之间的互引关系;有学者
以CSSCI 2006—2007年图书情报学来源期刊为数据源,采用社会网络分析,对该学科期刊形成的引用网络结构进行解析,为期刊布局与评价提供
[5]了定量支持;有学者考察了参考咨询领域内的
的社会网络,反映了研究者之间信息与知识传递的结构特征。分析这一网络,可以揭示学科发展中研究人员之间知识流动的状况,推断学科发展——————————
*
32位高被引作者的互引关系,发现了该学科领域
本文系2009年度教育部人文社会科学研究规划项目“中国高等教育研究演变:1979—
2008——基于CNKI 中国引文数据库‘高等教育专题’高被引论文的内容分析”(项目编号:09YJA880087)、上海市教委重点学科建设项目资助(比较教育学)(项目编号:J50404)及上海师范大学“教师教育学科群内涵建设工程”教育管理学重点学科建设项目(项目编号:1-3-34)研究成果之一。
[6]具有突出贡献的作者和研究热点。“有证据表本研究样本取自CNKI 中国引文数据库(新)“高等教育专题”中1979年以来的论文,截止日期为2008年12月31日。我们将高被引论文的入选标准设定为被引次数13次及以上的论文,筛选出符合此标准的论文4253篇。从中选择发表高被引论文数排前50位作者的505篇高被引论文为统计对象,分析这505篇高被引论文作者的互引关系。这50位作者(即顶点),发表高被引论文最多者28篇,最少者7篇。按发表高被引论文数从多到少排列对作者进行编号,论文数相同则按作者姓名的拼音首字母顺序排列,具体编号和姓名的对应。(见表1)
明,绝大部分对科学进展起作用的研究工作都是
[7]由少数科学家做的。”本研究仅以1979—2008
年中国高等教育研究领域所发表的高被引论文数排前50位作者组成的群体为研究对象,运用网络分析技术,探讨这一群体由高被引论文互引关系所构成的社会网络,分析他们之间的信息与知识流动关系特征,从而为我国高等教育学学科发展现状提供新的描述视角和解释证据。
二、研究方法
(一)研究取样
表1
编号[1**********]
作者潘懋元眭依凡刘献君杨叔子王伟廉别敦荣邬大光蔡克勇顾明远刘宝存
编号[***********]20
50位高被引论文作者(顶点)编号与姓名对应表
作者王冀生李文利刘智运张应强钟秉林武书连杨德广赵沁平蔡国春陈学飞
编号[***********]30
作者丁小浩沈红田建国谢安邦谢作栩周远清胡建华康宁卢晓东王义遒
编号[***********]40
作者王英杰王战军薛天祥钟宇平周川朱旭东冯向东龚放管培俊纪宝成
编号[***********]50
作者李曼丽卢晓中马陆亭秦惠民王大中文辅相杨东平张德祥赵蒙成赵婷婷
(二)分析框架
本研究主要运用社会网络分析软件Ucinet5.0,分析50位作者505篇高被引论文的互引网络结构特征。研究的思路是:先分析互引网络整体特征,再分析子群特征,最后讨论顶点与边的显著性。
整体特征主要涉及网络的度分布、紧凑性和连通性。度分布,包括出度分布和入度分布,指某
[8]一度数的顶点在网络所有顶点中所占的比例;
[12]即内部密度高,外部密度低的区域;强互惠子[13]图即由相互往来的顶点所构成的子网络。
顶点和边的显著性,指顶点或边在网络中的
[14]地位或作用。顶点的显著性可通过以下三个方
面来揭示。接近性,即某个顶点与其他顶点的距
[15]离和。PageRank 即Google 采用的网页排序指[16]标,用来衡量顶点的影响力。中间度,即一个顶
点能在多大程度上成为他人联系的中间人,控制
[17]他人之间的联系。边的显著性,主要使用边中
紧凑性,可用网络密度和网络中心势来描述,网络密度指顶点间联系的多少,网络中心是指网络能
[9]够在多大程度上围绕某些特定点组织起来;连
间度,即一条边能在多大程度上成为其他顶点联
[18]系的中介并控制顶点间的联系。
(三)数据搜集与处理
从CNKI 数据库中提取表1中作者发表的505篇高被引论文的被引记录,排除不在表1中出现的作者的引用和作者自引,统计50位作者之间的互引数据,在EXCEL 中建立50×50的矩阵,初始值设为0。如果顶点1的论文被顶点2引用了一
通性是指有多少顶点能相互可达及可到达需要的
[10]最少步数(距离)。
子群特征分析,包括观察互引网络核心区域的存在状况,即拥有至少k 个邻居的顶点组成的
[11]子网络及其核塌缩序列;有无明显的社群结构
次,表格中顶点1和2对应单元格增加1,使得顶点1的出度增加1,顶点2的入度增加1。有共同署名论文,系50位中的作者,每位作者同等对待,分别记数,构造出加权网络。加权网络中边权表示有多少次引用,可参见图1a。把加权网络中不为0的位置记为1,就生成无权网络。无权网络
中,边表示有无引用,1表示有,0表示没有,参见图1b。
网络中不是所有顶点对间都存在信息与知识流动,由相互可达的顶点构成的网络被称为强连
[19]通子图。50位高被引论文作者互引网络的强
连通子图有40个顶点。(见图1c )
a 加权网络
图150
位高被引论文作者互引网络
b 无权网络c 强联通子图
图1a 中,顶点大小表明出度(被引)的多少,边的粗细表示边权的大小。可直观看出顶点1最大,出度最高(29),边12→22最粗,顶点22引用顶点12次数最多(9次)。从图1a 和图1b 都可以看出顶点36为孤立点,与其他49个顶点没有联系。图1c 中的40个顶点相互可达,与另外10个顶点相比,联系更为紧密。
在图1的基础上,使用社会网络分析软件Ucinet5.0计算各种网络指标,并用数学软件
[20]Matlab7.0绘制度分布图和计算PageRank 值。
出度分布
图2a 50
位高被引论文作者互引网络度分布
三、网络分析结果
(一)网络整体特征
Seglen 发现,论文的引用与被引都服从幂律
[21]分布(power-law );Redner 对ISI 与PRD 论文引[22]文研究表明,幂律分布现象普遍存在。图2描
述了50位高被引论文作者互引网络的出度分布和入度分布。
图2a 和图2b 显示,50位高被引作者互引网络的出度与入度分布都出现了类似幂律分布现象。顶点出度和入度的描述性统计见表2。
从表2可见,50位高等教育高被引作者互引网络顶点的出入度相关系数不大,这说明引用多的学者并不一定被引多。网络存在最小出度或最
图2b
入度分布
50位高被引论文作者互引网络度分布
小入度为0的顶点,说明存在只有被引或引用行为的学者。这些学者要么只把50
名以外学者的
表2
网络加权无权
总度数240161
平均度4.83.22
50位高被引论文作者互引网络顶点度的描述性统计
出度标准差入度标准差出入度相关系数最大出度最小出度最大入度最小入度5.0792.788
4.722.859
0.5160.589
2915
00
2215
00
信息与知识传入网络,要么只是把网络中的知识传到网络之外。无权网络的总度数为161,可计算出:网络密度为0.066,网络中心势为24.5%。前者说明网络凝聚力的总体水平不高,后者说明
表3
顶点数
平均距离
网络内聚性不太大。根据这两个特征,可认为整个网络紧凑性不高,顶点间联系不太多,还不能把这个网络看成围绕某些特定顶点组织起来的结构。
50
位高被引论文作者互引无权网络的距离
紧密度
幅度
高频距离距离2342
比例0.2640.3350.2050.2880.3330.193
7
0.002
19→4347→4348→43
8
0.001
43→44
距离
最大距离比例
路径
整个网络503.0370.3220.678
强连通子图402.9350.4120.58834
由表3所示的顶点间距离比较可知,强连通
[23]子图的直径比整个网络的最大距离缩小了1,
调和平均距离[24]缩小了0.078,紧密度增加了0.09,差异不太明显。平均距离均在3左右,表明任意两个顶点间平均大约通过两个其他顶点产生联系。距离为2、3、4的顶点对出现的比例最大,这说明两个顶点间大多是通过其他一到三个顶点而产生相互联系,信息与知识在网络中的直接流动不多。不在强连通子图中的10个顶点只影响到网络局部或者只受到网络局部的影响,但不排除因50名之外的作者的引用关系使连通性发生变化。
(二)子群特征
Seidman 提出,使用k-核分析可以发现网络
[25]的高凝聚力区域。以图1(b )的出度为基础进
图350位高被引论文作者互引网络有向3k-核心网络
点36、42和23)后,网络结构在总体上具有一定的
[28]一致性。较低的k 值(0.06)后没有出现0值,
表明50位高被引论文作者互引网络不存在密度特别高的区域。
表450位高被引论文作者互引网络k-核的塌缩
k 值01234
剩余点数
31518140
比例0.060.30.360.280
核点数504732140
比例10.940.640.280
行k-核分析,生成了有向3k-核心网络。(见图3)
图3可见,在3的k-核心网络中,只存在14个顶点。可以认为,这14个顶点学术联系比较紧密和活跃,是整个网络主要的知识来源。
核塌缩序列指当k 值增加1时损失的顶点数
[26]与比例。表4可见,50位高被引论文作者互引
网络的核塌缩序列为(0.06、0.30、0.36和0.28),除0.06之外,其他三个比例差异不大,可认为核的塌
[27]缩是逐渐的,说明去掉3个出度为0的顶点(顶
采用Girvan-Newman 快速分群算法对网络进
[29]行分群,Q 值最大不超过0.3,无法说明网络存[30]在明显的社群结构。任意两个有相互引用关系
的顶点所构成的子网络,被称为强互惠子图。50位高被引论文作者互引无权网络的强互惠子图见图4。
点和24条边的规模较大的子图、一个由3个顶点以及另一个由5个顶点构成的链。强互惠子图说明,30位高被引作者形成了一个较大的学术共同体和两个较小的学术伙伴群。与顶点1有引用关系的21个顶点,9个邻居与之有强互惠关系,表明这9个顶点与顶点1的联系更为紧密。顶点1、29、32、13和3处于相对核心和关键位置,对所在子图连通性有影响。这5个顶点的邻居之间只有顶点3和13有强互惠关系,说明处于关键和核心位置的顶点之间缺乏直接联系。
(三)顶点与边的显著性
顶点的显著性表征学者在本领域内的威望、
图450位高被引论文作者互引网络强互惠子图
影响或受关注程度。边的显著性指引用的重要性和关键性,可以衡量某引用关系对于网络整体性的影响。表5
反映顶点和边的显著性。
PageRank [***********]
0.10.0770.0630.0540.0440.0410.0390.03520.0340.0330.02130.02010.10.003
顶点中间度[**************]0
34.39412.73212.35610.4888.9597.9547.8637.2846.7786.1363.3295.58834.3940
边中间度1→327→16→250→119→201→111→2932→183→3529→1
170.986154.333113.211110.82586.38977.38373.96471.47470.75370.20336.341630.6999170.9860
图4显示,强互惠子图由30个顶点和30条双向边组成,分离成三个区域,包括:一个有22个顶
表5
排序[1**********]均值标准差最大值最小值
[1**********]0、13111432
外接近性
52.70346.98845.88244.31843.8243.33342.39141.05340.20639.79635.6117.11352.70322.674
[1**********]6、201122、2715
内接近性
53.42546.42943.33342.85742.39141.48941.05340.62539.7963935.2516.4553.42522.159
50位高被引论文作者互引网络顶点与边的显著性TOP 10
表5可见,顶点1、13和29都排在前10位。顶点1的显著性尤其明显,所有指标都排在第一位。这说明顶点1在高等教育研究领域威望很高,具有非常大的影响。同时,顶点13和29的作用也不可忽视。顶点32、20、6和10有三个指标排在前10位,在本领域中也有相当大的影响。虽然顶点50的高被引论文不多,但内接近性与PageRank 都排在前10位。这说明顶点50经常受到他学者关注,具有较大的发展潜力。这与顶点50引用过顶点1和17,而且被顶点1引用过有关。与顶点1联系的21个顶点中,有13个出现在前10位中,这说明与某些显著性高的顶点发生学
术联系会提高自己在特定学术网络中的显著性。
表5显示,边中间度上,与顶点1有联系的边有6条,其中边1→3具有最大的边中间度。这说明与顶点1发生的联系,在很大程度上控制了其他顶点之间的联系。
四、总结
本研究讨论的50位高被引论文作者互引网络,是在作为信息网络的引文网络基础上衍生出来的社会网络。这一网络反映了高等教育学高水平研究人员之间信息与知识传递的结构特征和知
识流动状态。综合上述分析,我们可以得出以下初步结论与观点。
第一,互引网络的出度分布与入度分布呈现了类似幂律分布现象,高等教育研究领域同样具有“少数作者被大量引用”和“大量引用来自于少数作者”的特征。
第二,虽然互引网络出现了学术联系比较紧密和活跃的较大群体,但网络结构总体呈现一定的一致性,不存在密度特别高的区域和明显的社群结构。这可理解为,高等教育学学术流派尚未形成,研究群体分工不明确,研究领域较为宽泛。
第三,虽然有以顶点1为代表的威望高、影响大的多位核心人物,整个网络的知识主要来源已现雏形,但网络紧凑性不高。整体上看,高等教育学还不是一个围绕共同规范建构而成的学术共同
[31]体,学科发展尚处于前科学阶段。这也许与高
[2]林聚任.社会网络分析:理论、方法与应用[M ]. 北京:北京师范大学出版社,2009. 36—37.
[3]OtteE,Rousseau R. Social Network Analysis:A Powerful Strategy,Also for the Information Sciences [J ]. Journal of Information Science,2002,(6).
[4]姜春林,等.CSSCI 管理学来源期刊引文网络结构分析[J ]. 科学学与科学技术管理,2009,(7).
[5]宋歌,叶继元.基于SNA 的图书情报学期刊互引网络结构分析[J ]. 中国图书馆学报,2009,(5).
[6]徐媛媛,朱庆华.社会网络分析法在引文分析中的实证研究[J ]. 情报理论与实践,2008,(2).
[7]李醒民.学术界需从多方面“精兵简政”[N ]. 科学时报,2010-6-4.
[8][12][18][24]NewmanM. E. J. Structure and Function of Complex Networks [J ]. SIAM Review,2003,(2).
[9][10][11][13][15][17][26][27][28]斯科特.社会网络分析法(第二版)[M ]. 重庆:重庆大学出版社,2007. 68、173、94、25、71、72、92、94、94.
[14][19][23]WassermanS,Faust K.Social Network Analysis:Methods and Application[M ]. New York:CambridgeUniversity Press,1994. 169、133、134.
[16]PageL.,et al. The PageRank Citation Ranking:Bringing Order to the Web [EB/OL]. http://dbpubs.stanford.edu/pub/1999-66.
[20]MolerC. B. Matlab.数值计算[M ].北京:机械工业出版社,2006.62—68.
[21]SeglenP. O. The Skewness of Science [J ]. Journal of the American Society for Information Science and Technology,1992,(9).
[22]Redner S. How Popular Is Your Paper?An Empirical Study of the Citation Distribution [J ]. European Physical Journal B,1998,(2).
[25]Seidman S. B. Network Structure and Minimum Degree [J ]. Social Networks,1983,(3).
[29][30]Newman M. E. J. Fast Algorithm for Detecting Community Structure in Networks [J ]. Physical Review,2004,(6).
[31]T.S. 库恩.科学革命的结构[M ]. 上海:上海科学技术出版社,1980.9.
[32]张应强,郭卉.论高等教育学的学科定位[J ]. 教育研究,2010,(1).
[33]高耀明,范围.中国高等教育研究方法:1979—2008——基于CNKI 中国引文数据库(新)“高等教育专题”高被引论文的内容分析[J ]. 大学教育科学,2010,(3).
[34]WhiteH. D.,etc. Does Citation Reflect Social Structure?Longitudinal Evidence from the “Globenet”Interdisciplinary Research Group [J ]. Journal of the American Society for Information Science and Technology,2004,(2).
等教育学研究领域特点、学科性质和发展方式有
[32]关。
第四,强连通子图分析可见,顶点平均距离在3左右,任意两个顶点间平均大约通过两个其他顶点产生联系。距离为2、3和4的顶点对出现的比例最大,两个顶点间大多是通过其他一到三个顶点而产生相互联系。强互惠子图分析发现,只有5个顶点处于相对核心和关键位置,对所在子图连通性有影响,而这5个顶点的邻居之间只有2个顶点有强互惠关系。这说明,高等教育学领域高水平学者信息与知识的相互流动以间接为主,无法观测到他们的研究之间存在明显的继承和发展。这可能是以思辨研究为主的高等教育研究方
[33]法论导致的。
由于取样的特殊性,本研究结果只能说明高等教育领域高水平研究人员由互引产生的信息与知识流动关系,解释整个学科领域还需要更多证
[34]据。此外,论文引用模式存在社会因素,引用
一定程度上也反映了作者之间特定的人际关系,所以,作者的学术联系与其他联系的耦合研究也可以作为下一步的研究任务。————————
参考文献:
[1]毛军.社会化引文网络和科学范式的重建[J ]. 图书情报工作,2006,(9).
(下转第100页)
The Breakthrough of Pushing Forward Teaching Theory Research
Li Songlin
Abstract :The current teaching theory research is facing three major bottlenecks. Firstly ,it emphasizes on the
teaching theory research to return to the original point ,but it hasn't formed the research problem domain based on the of the discussion on several mechanism issues under the teaching conditions ;thirdly ,it strongly advocates the original research of the original point issues such as discipline ,knowledge ,capability ,learning and development ;focusing on the intrinsic mechanism issues of students' learning and development under the teaching conditions with the theme of learning facts.
original point ;secondly ,it tries to change the embarrassment of the teaching theory without learning ,but it is badly short research of teaching theory ,but as a whole ,it hasn't been able to get out of the research paradigm of logical deduction. The breakthrough of pushing forward the teaching theory research lies in returning to the original point to focus on the
and development ;and emphasizing on the summing up and summarizing of practical experience based on the teaching
Key words :teaching theory research ,research paradigm ,discipline development
Author :Li Songlin ,Deputy Director and professor of School of Education ,Sichuan Normal University (Chengdu
610068)
[责任编辑:金东贤]
(上接第61页)
A Network Analysis about Highly Cited Papers
Authors' Inter-citation in Higher Education Research
Gao Yaoming ,Li Li &Kou Linna
Abstract :By recruiting 505highly cited papers of 50scholars in higher education research including the global
features ,subgroup characteristics and prominence ,network analysis is used to investigate the inter-citation network. It is found out that the degree of distribution is similar to power law distribution ;the compactedness is lower ;there is no a high density region and an obvious community structure ;the mutual-flow of information and knowledge is indirect ,the So the higher education research hasn't become an academic community surrounded with common rules ,and it is still a pre-science discipline.
Key words :higher education research ,highly cited papers authors ,inter-citation network ,network analysis Authors :Gao Yaoming ,Director ,professor and Ph.D. of Department of Education Administration ,College of
academic schools have not been formed ,and the academic relationship and inheritance are indistinct among core scholars.
Education ,Shanghai Normal University ;Li Li ,associate professor of Department of Education Administration ,College College of Education ,Shanghai Normal University (Shanghai 200234)
of Education ,Shanghai Normal University ;Kou Linna ,graduate student of Department of Education Administration ,
[责任编辑:杨雅文]