国内外信息生态研究的可视化分析_支凤稳
国内外信息生态研究的可视化分析
支凤稳1,张海涛1,2,许孝君1,姚佳含1,翁毓琦1
(1. 吉林大学管理学院,吉林长春130022;2. 吉林大学信息资源研究中心,吉林长春130022) 摘
要:文章以WOS 和CNKI 收录的题名中含有“信息生态”的期刊论文作为数据来源,借助软件
Citespace Ⅱ绘制了可视化的知识图谱。同时,对中外信息生态的年度发文量、国别分布、研究热点、知识基础及研究前沿的作了对比分析,为国内信息生态研究者提供必要的参考依据。关键词:信息生态;Citespace Ⅱ;知识图谱;可视化分析中图分类号:G250
文献标识码:A
文章编号:1007-7634(2013)02-156-05
Visual Analysis of Research on Information Ecology between China and
Foreign Countries
ZHI Feng-wen 1,Zhang Hai-tao 1,2,XU Xiao-jun 1,YAO Jia-han 1,WENG Yu-qi 1
Abstract:Using Journal articles whose title contains “information ecology ”form CNKI and WOS as data
2. The Information Resource Research Center of Jilin University ,Changchun 130022,China)
(1. The Management College of Jilin University ,Changchun 130022,China;
sources, the paper draws mapping knowledge domains by operating Citespace Ⅱ. Meanwhile, it makes some comparative analysis on the number of papers published annually , national distribution, hot topics, foundation and frontiers of researches on information ecology between China and foreign countries to provide essential references for domestic researchers of information ecology to do further researches. Keywords:information ecology ;citespace Ⅱ;mapping knowledge domains ;visual analysis
作为信息科学与生态学相互交叉而出现的一个全新的研究领域, 信息生态把人、信息及信息环境作为一个整体来看待。信息生态主要集中研究因特网环境下的信息链、信息质量、信息环境和管理问题, 研究的内容比较宽泛, 涉及整个信息社会的范围【1】。随着信息化进程的不断深入,网络社会的到来,信息生态已成为一个日益重要的、跨越诸多领域的复杂问题。而目前对中外信息生态现状总结和综述的研究较少,本文通过Citespace II 工具对中外信息生态做比较研究,以期为国内信息生态研究者的相关研究工作起到抛砖引玉的作用。
收稿日期:2012-08-31
基金项目“:吉林大学‘985工程’项目
作者简介:支凤稳(1987-),女,河南人,博士研究生.
1数据来源与研究方法
1.1数据来源
ence (WOS )数据库。WOS 是美国汤姆森科技信息集团基于WEB 开发的产品,是ISI 数据库中的核心期刊引文索引数据库,包括8000多种世界范围内最
本研究所使用的英文数据,来源于Web of Sci ⁃
有影响力的、经过行专家评审的高质量的期刊【2】。该数据库更新及时,每周更新。本研究所使用的中
--
文数据,来源于中国学术期刊网络出版总库,该数据库以学术、技术、政策指导、高等科普及教育类期刊为主,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域,核心期刊收录率期刊全文数据库。数据来源如表1所示。
表1研究的数据来源
研究范围数据库检索方式文献类别时间跨度检索结果检索时间
article
国际
中国
中国知网(CNKI )
年份
[**************]9中国1020国际0008年份[**************]5表2中外年度发文量(篇)
中国国际
53376488年份
[**************]1中国国际[**************]96%,它是世界上最大的连续动态更新的中国学术
由表2可知,国际信息生态的研究始于1999年,中国研究始于1992年,这说明中国对信息生态的研究起步较早。18年来,中国共发文262篇,国际发文量118篇,中国发文量远大于国际发文量。笔者在表2的基础上绘出了两者文献增长的趋势(见图1)。
标题=(InformationEcology)
篇名=“信息生态”
OR(InformationEcological) 1995-2012年118篇
期刊论文1995-2012年262篇(去掉会议论文)
1.2研究方法
科学知识图谱是显示科学知识的发展进程与结构关系的一种图形,是揭示科学知识及其活动规律的科学计量学从数学表达转向图形表达的产物,是显示科学知识地理分布的知识地图转向以图象展现知识结构关系与演进规律的结果【3】。
CitespaceⅡ是陈超美博士用Java 语言开发出来
图11999-2012年中外信息生态发文量的增长趋势图
由图1可见,从1999年来,国际信息生态论文的发文量总体呈上升的态势,2010年达到最大文献量14篇,约占发文总量的12%。1995年,陈曙的《信息生态的失调与平衡》与《信息生态失调的剖析》揭开了中国信息生态研究的序幕,2004年以后,发文量开始快速增长,2010年的增幅最大。由于2012
年的论文没有全部出版,所以中外信息生态的发文量在2012年都出现了下降的趋势。国际信息生态的研究起步晚于中国,增幅没有中国大,但中外的总体趋势基本一致。
2.2国际信息生态论文的国别(地区)分布
的可视化分析软件。该软件通以时间为变量从研
究前沿到理论基础来探索一个学科热点的发展机
制,它允许用户对某一领域根据时间顺序进行“快照”,然后把这些“快照”连接起来,演绎出这一领域研究热点的变化过程【4】。
本研究主要利用软件CitespaceⅡ绘制科学知识图谱,在此基础上对中外信息生态的研究的情况进行对比分析。英文数据直接用CitespaceⅡ绘制图谱,用刘盛博博士开发的软件把中文数据转换为CitespaceⅡ可以识别的数据格式,再利用Citespace Ⅱ进行分析。由于标题中含有“信息生态”的期刊论文在国际WOS 中发表的最早时间为1999年,而篇名中含有“信息生态”的期刊论文在CNKI 中发表的最早时间为1995年,而为了便于同期比较,把时间范围设为1995年至2012年,共18年。
“年轮”的厚度和颜色形象地表示出来。在
CitespaceⅡ软件可把各国的发文数量及时间用
CitespaceⅡ界面中,Term Type 选择Noun Phrases ,Node Types 选择Country 和Institution, 设置好阈值,然后运行CitespaceⅡ软件,得到信息生态研究的国别和机构的综合性知识图谱。其中,图谱中的数字代表发文数量,较大的年轮节点代表发表论文的国家,节点越大表示该国发文越多;较小节点代表发表论文的机构,节点越大表明该机构被引频次越高,即影响力越大(见图2)。为了便于比较分析,笔者列出了1995-2012年间发文3篇以上的国家和地区(见表3)。
由图2和表3可以得到各国家(地区)的发文情况:美国从1999年首次发文开始,共发文38篇,占
-157-
2中外信息生态研究的对比分析
2.1发文量比较分析
分别检索出中外每年的发文量(见表2)。
发文总量32.2%,是国际信息生态学术论文产量最大的国家;加拿大发文10篇,位居第二;澳大利亚、英格兰、荷兰等发文也比较多。发文较多的机构是US EPA(美国环保署) 、Rutgers State Univ(美国罗特Skovde(瑞典舍夫德大学) 、Univ Melbourne(澳大利亚
键词对比表,该表显示了中外信息生态的主要研究热点及出现的频次(见表4)。
格斯州立大学) 、Univ Nacl Autonoma Mexico(墨西哥国立自治大学) 、Univ Lllinois(伊利诺伊大学) 、Univ 墨尔本大学) 、Univ Kansas(美国堪萨斯大学) 、Texas Tech Univ(美国德克萨斯科技大学) 、UCL (伦敦大学学院)等,这些发文较多的机构也主要分布在美国。综上,美国是世界上信息生态研究水平最高的国家。中国国内学者从1995年就开始了对信息生态的研究,并发表了262篇中文学术论文(见表的论文3篇,只占发文总量的2.5%,发文数量相对2)。但中国在WOS 上发表题名中含有“信息生态”较少,远远落后于美国、加拿大、澳大利亚等国。中国首次发文时间为2008年,起步较晚,比美国、澳大利亚、英格兰等晚近10年,比台湾地区也晚2年。WOS 收录是世界范围内高质量的英文学术论文,发表难度较大,而中国的第一语言又不是英语,中国在这方面不占优势。但中国在信息生态方面的研究水平与世界其他国家存在较大的差距的原因远不止于此,这是值得中国信息生态方面的研究者沉思的。
图3中外信息生态研究的关键词聚类图谱
由图3可得,国际的信息生态的118篇论文中的共有349关键词,并没有形成很明显的聚类,其中出现频次较高的是“ecology ”、“evolution ”、“informa⁃tion theory ”、“model ”、“birds ”、“systems ”“ecosys⁃184个关键词,主要有“信息生态”与“信息生态系统”两个大的聚类,这说明它们是18年来中国信息tems ”等。中国信息生态研究的262篇论文中共有
生态研究的热点,另外“信息生态位”、“信息生态链”、“信息生态环境”、“信息”、“信息环境”、“图书馆”等出现的频率也较高,也是我国信息生态研究的热点。
表4中外信息生态研究的关键词对比表
序号23456789国内关键词信息生态信息生态系统信息生态位信息生态链信息生态环境信息
信息环境图书馆
信息生态学信息管理
频次[**************]0国外关键词evolution
Information theory model birds systems ecosystems Model selection
Ecological risk assessment 频次75555444图2国际信息生态的国别分布图谱表3国际信息生态的国别(地区)分布表
名次234567国家国家
发文量首次发文名次发文量首次发文
(地区)(地区)美国
加拿大澳大利亚英格兰荷兰德国俄国意大利
[***********][***********]2131415葡萄牙西班牙苏格兰日本墨西哥巴西中国台湾
[***********][1**********]8由图3和表4可知,国际的信息生态的关键词
较多,分布广泛,每个关键词在118篇论文中出现的概率差别不大,频次最高与最低的关键词在每篇文章中出现的概率分别为0.068(8/118)与0.008(1/118)。中国信息生态的关键词个数较少,分布相对最高与最低的关键词在每篇文章中出现的概率分别为0.424(111/262)与0.004(1/262)。这就说明国际在信息生态方面的研究范围广泛,而中国在这方面的研究相对集中。对比国内外出现的关键词,可见两者之间存在相同的热点,如信息,当然也有各自的独特研究领域; 相同的热点领域反映了国内外对信息生态研究的交集,也是国内外研究的主流领域。国内不同于国外的热点突显了国内研究的特色,当然而国外不同于国内的热点也应该是国内研究者们努力的方向。我国研究者应在积极研究两集中,最高出现111次,出现的概率差别较大,频次
2.3中外信息生态研究的关键词比较分析
Phrases ,Node Types 选择Keyword, 设置好阈值,然后3) 。图中每个彩色“年轮”代表一个研究热点,结点的大小反映该关键词的出现次数的多少。同时笔--
在Citespace Ⅱ界面中,Term Type 选择Noun
运行软件,得到信息生态研究热点的图谱(见图
者根据CitespaceⅡ运行的结果,整理得到了热点关
者共同领域的同时,进一步深入独有的研究领域,同时在借鉴国外热点词汇的基础上,开拓信息生态的相关研究领域。
2.4知识基础分析
序号1
篇名
信息生态研究
表5中国信息生态论文被引前10名的文献信息
第一
作者陈曙
刊名
年/期
被引频次[***********]45
动态概念和潜在的研究问题,而研究前沿的知识基
2009年,陈超美把研究前沿定义为一组突现的
础则是它在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络) 的引文和共引轨迹
【5】
。知识基础是一个有利于进一步明晰研究前沿本
质的概念【6】。信息生态研究的知识基础可以分为两类:第一、信息生态研究的早期奠基性文献;第二、共被引频次和中心性都比较高的关键文献。它们形成了信息生态研究的脉络, 组成了信息生态的坚固基础。共引网络图谱是展示学科知识基础的一个重要方法,它使用户对“知识域”进行“光谱分析”,展示出知识基础。Node Types 选择Cited Refer ⁃ence, 设置好阈值,然后运行软件,获取国外信息生态研究的timeline 图(见图4)。
图书与情
1996/02
报
构建和谐“信息生态”突围中国远程2余胜泉2006/05
教育信息化困境教育
情报资料
3信息生态的失调与平衡陈曙1995/04
工作
4信息生态学的初步研究张福学情报科学2002/01
信息生态失衡的根源及对5王东艳情报科学2003/06
策分析
6信息生态问题初探田春虎情报杂志2005/027信息生态系统的剖析李美娣情报杂志1998/04
信息生态平衡及其在构建8娄策群情报科学2006/11
和谐社会中的作用
情报理论
9信息生态链:一个理论框架韩刚2007/01
与实践
以人为本的信息生态系统情报理论10张新明2007/04
构建研究与实践
对比中外有关信息生态的高被引文献,可以看出:在高被引文献中,中国文献被引频次远远大于国际,我国被引频次前5都大于60次,排名第1的达83次之多,而国际被引最高频次为7,但国际上的高1996年,而国际高被引文献发表的最早时间为2002
被引文献却没有中国的。从发表时间来对比这些文献,国内有关信息生态研究的高被引文献发表在年。这说明中国的高被引文献已引起国内同行的关注,但在国际上的影响力并不大。从研究内容上看,国际更注重对信息生态创新性和实用性的研究,而国内则注重对信息生态的特征、重要性、实现障碍等方面,仅有少量文献对信息生态的具体应用进行了研究,这导致了国内信息生态研究水平与国际的差距进一步加大。
2.5中外信息生态研究的前沿分析
图4国外信息生态研究的timeline 图
图4中有412个节点、338条连线,每个节点代
表一篇文献,节点越大代表该文献被引次数越多;节点间的连线代表文献间的引用,连线越粗代表共引次数越多,文献的研究问题越相近。信息生态研究的最早被引文献是Babbage C 于1837年撰写的图书《The Ninth Bridgewater Treatise, a fragment 》,早期奠基文献中被引频次最高的是Burnham K.P. 于2002年出版的名为《Model Selection and Multi-Model In ⁃Second Edition 》(被引7次)图书,其次是Kullback S. mation and Sufficiency 》(被引5次)与Shannon C.E. 于1948年发表在《Bell System Technical Journal 》(被引等,这些文献为信息生态的研究奠定了基础。在结果按被引频次排序,得到被引前10名的文献,这些文献是我国信息生态研究的基础文献(见表5)。ference:A Practical Information Theoretic Approach, 于1951年发表在《Ann Math Statist 》上的《On Infor ⁃
最早提出“研究前沿”概念的是科学计量学的奠基人普赖斯,并用它来描述研究领域的动态本质,他认为某个领域的研究前沿是由科学家积极引用的文章所体现的【7】。Citespace Ⅱ可以生成强调研究前沿和其知识基础间的顺时模式时区视图,研究前沿指向知识基础【8】。时区视图是由一系列表示时区的条形区域组成,时区按时间顺序从左向右排列,它可以清晰地表示知识的演进,展示出文献的更新和互相影响情况。时区视图将节点定位在一个二维坐标系中,根据节点首次被引用的时间,节点被放在不同的时区中,并且所放位置的高度依次增加,位于坐标系左上的节点可以认为是该领域的研究前沿【9】。利用Citespace Ⅱ的突变词探测技术和
-159-
5次)上的《A Mathematical Theory of Communication 》CNKI 中,以“信息生态”为篇名进行检索, 并把检索
算法,结合词频时间分布,将频次变化率高的词从主题词中探测出来,根据词频变动趋势而不仅仅是频次的大小,来确定研究前沿领域和发展趋势【10】。设置好参数,运行Citespace Ⅱ,得到中外信息生态研究前沿领域和发展趋势的时区视图。图中的每一个彩色的正方形节点代表一个前沿热点词汇,节点越大代表该词汇出现的次数越多,受到的关注程度越大(见图4)。
论文数量的增加,中国的信息生态研究水平与美国、澳大利亚、英格兰等国家存在较大的差距。
⑶中外信息生态的研究热点具有的相似性,如
对信息生态系统、信息等重要领域的研究,这说明我国信息生态的研究方向和国际大体一致。同时中外都有自己独有的研究内容,如国外对进化、生态风险评价等的研究,国内对图书馆、信息生态链等的研究。中国应在明确自己的研究特色的基础上,拓展研究领域,以进一步推进信息生态的研究。频次、发表时间及研究内容,可以得知,中国信息生
⑷通过对中外信息生态的高被引文献的被引
态的研究已引起了学者的重视,取得了较大的进展,但国内发表文献的质量普遍低于国际平台上出版的文献的质量。因此,国内信息生态文献的质量
图4中外信息生态研究的发展趋势
有待进一步提升。
图4显示了1995-2012年间国际信息生态的研究前沿,它是由一组最新热点词汇构成的,代表着信息生态研究领域的思想现状,该图也直观的展现了信息生态18年的发展脉络。其中频次较高的前沿词汇主要有ecological information ,geographic information ,aquatic ecosystems ,temporal scales 等,它们与知识基础有紧密的联系,代表了国际信息生态研究的大致趋势。图4显示了中国信息生态的研究前沿,其中频次较高的前沿词汇主要有信息生态、信息生态环境、信息管理、网站设计、信息构建、信息生态链、信息服务机构等,它们指向知识基础,展示了中国信息生态研究领域的现状,代表了中国际信息生态研究的大致发展趋势。
信息、地理信息、时间尺度等,这些前沿词汇为国内
⑸国际信息生态频次较高的词汇主要有生态
指明了研究的方向。即国内应注重对信息生态创新性、实践与应用的研究,拓展信息生态的研究领域,提高我国的学术水平。
参考文献
1张新明, 王2王3陈
振, 张红岩. 以人为本的信息生态系统构建研
涛,等. 基于知识图谱的国际竞争情
究[J].情报理论与实践,2007,30(4):531-533.
萍, 支凤稳, 沈
报研究的可视化分析[J].情报科学,2012,30(6):925-929.2005,23(2):149-154.
悦, 刘则渊. 悄然兴起的科学知识图谱[J].科学学研究,
3结语
4张兆锋, 张志平, 乔晓东, 等. 信息可视化在科技文献深度挖掘中的应用[J].情报学报,2007,26(3):408-414.与可视化[J].陈401-421.
5陈超美.Citespace Ⅱ:科学文献中新趋势与新动态的识别6Pemson O.The intellectual base and research fronts of Information Science,1994,45(1):31-38.报,2011,37(192):40-49.
悦, 等译. 情报学报,2009,28(3):
通过对1995-2012年间中外信息生态研究论文的年度发文量、国别分布、关键词、知识基础及研究前沿的可视化对比分析,分别可得出以下结论:
⑴国际有关信息生态的研究起步晚于中国,增
jasis 1986-1990.Journal of the American Society for
幅没有中国大,但中外的发文量总体上都在逐渐增加。18年来,中国共发表有关信息生态研究的论文262篇,而国际只发文量118篇,中国发文量大于国际发文量。
7赵蓉英, 王菊. 图书馆学知识图谱分析[J].中国图书馆学8刘泽渊, 陈
悦, 侯海燕. 科学知识图谱:方法与应用[M].北
京:人民出版社,2008:60-70.2012,29(2):109-112.
文最多的国家,信息生态论文的主要发文机构也集中在美国,可见美国是世界上信息生态研究水平最高的国家。中国发表论文质量的提升明显滞后于--
⑵美国是在WOS 上发表有关信息生态学术论
9杨国立. 我国统计学研究的知识图谱分析[J].统计研究, 10马丽娜, 赵蓉英, 王
敏. 基于知识图谱的国内外企业知识
(实习编辑:赵红颖)
共享比较研究[J].图书情报工作,2011,55(10):20-24.