利用文献计量学方法分析国外学术出版领域近5年研究进展_吕小东
利用文献计量学方法分析国外学术出版领域近5年研究进展
吕小东
1)
沈锡宾
2)*
收稿日期:2013-02-28修回日期:2013-05-14
1)中华结核和呼吸杂志,1007102)中华内科杂志,100710
E-mail:lvxiaodong@cma.org.cn北京市东城区东四西大街42号,
E-mail:robin@cma.org.cn北京市东城区东四西大街42号,
摘要目的利用文献计量学方法分析国外学术出版领域的研究进展。方法对2008至2012年SerialsReview(SR)、
LearnedPublishing(LP)、JournalofScholarlyPublishing(JSP)发表的论文所引用的论文进行统计,截取其中被引次数较高的部分据此将这些论文进行聚类分析,形成了该学科的多个研究方向的知识基础,从这些高论文并统计高被引论文同时被引用的次数,
被引论文聚类簇所对应的引用文献中挑选出与高被引论文关系最密切的、最具有代表性的当前论文,作为表示该分支学科各个研究基础的前沿。结果
被引次数高于4次的论文有35篇,对这些高被引论文进行同被引聚类分析结果显示,高被引论文多为
采用文献计量学方法可以勾勒出当前学术出版领域发展的静态结构。文本挖掘
研究进展
辑出版领域的研究热点及前沿,我们查阅了ThomsonReuters2011年度《期刊引用报告》(JournalCitationIndex,JCR),搜集了本领域的所有相关期刊,目前在社会科学引文索引(SocialScienceCitationIndex,SSCI)数据库共收录期刊学、编
[4]
辑学和出版学类期刊3种,分别是SerialsReview(SR)、
该学科研究中使用到的基本理论和重要工具,分别为科技写作实践与修辞学、机构存储与出版、开放获取与同行评议、科技期刊自引与质量控制,以及新阅读模式和新技术。结论关键词
文献计量学
高被引论文
学术出版
学术出版领域涉及范围相对广泛,比如新闻学、编辑学、出版学和图书情报学。关于此方面进展的综述鲜有报道,为此本研究采用文献计量学的方法对国外知名出版学术类期刊进行文本挖掘以讨论最近5年来的研究前沿。
所谓科学研究的前沿一般认为是科学研究中最先进、最最有发展潜力的研究主题或研究领域新、
[1]
。目前关于研究LearnedPublishing(LP)、JournalofScholarlyPublishing(JSP),各刊的基本情况见表1。我们选取3种期刊在2008年1月1日至2012年12月31日5年间发表的所有文献,总计期刊论文和综述共678篇,获得7086条参考文献(频数),来自于6537篇参考文献(种数)。1.2
数据分析
统计3种核心期刊参考文献的频次,根据信息科学中h指数的原理
[5]
前沿还有多种定义,本研究采用Persson提出的理念,即一个学科的研究状况由研究前沿和知识基础(intellectualbase)两部分随着时间变化的轨迹来表示,在信息管理学中,知识基础用同被引文献簇表示,研究前沿则由引用知识基础的最新文献群组成
[2]
。本研究中,对重要刊物上发表的论文所引用
的论文进行统计,截取其中被引次数较高的部分论文并统计高被引论文同时被引用的次数,以此将这些论文进行聚类分析,形成了该学科的多个研究方向的知识基础,结果表明这些高被引论文多为该学科研究中使用到的基本理论和重要我们从这些高被引论文聚类簇所对应的引用工具;相应的,
文献中挑选出与高被引论文关系最为密切的、最具有代表性的当前论文,作为表示该分支学科各个研究基础的前沿。前沿论文的筛选采用了聚类分析中描述度和区分度等指标
[3]
,截取出现频次较高的论文作为该学科的高被
引论文,以此代表该学科当前的研究热点及开展研究的基础知识。两两配对统计这些高被引论文同时被2008~2012年发表的其他论文所引用的情况,形成高被引论文的同被引矩GraphicalClustering利用聚类分析软件(gCLUTO软件,阵后,
Toolkit)进行双聚类分析(biclustering),同时获得高被引论文的分类和对应的引用文献的聚类结果。
分析每个聚类类别高被引论文的标题、文摘和全文,总结作为学术出版领域研究中经常引用的归纳相应的研究内容,
热点,可以是学术关注的焦点,也可以是研究中经常使用的方法和观点;同时,根据引用相应高被引论文的引用文献的内
。
1
1.1
资料与方法
调查样本的选择
为使本研究中所选择的分析样本能够较全面地反映编
*E-mail:robin@cma.org.cn通信作者:沈锡宾,
http://cjstp.ijournals.cn
2013,24(6)中国科技期刊研究,
—1044—
容,即2008~2012年发表在3种核心刊物上的、与该热点有关
表1
期刊名
SerialsReviewLearnedPublishing
JournalofScholarlyPublishing
的论文,可以了解到国际学术出版领域近年来研究的前沿。
SSCI收录的3种科技出版类期刊的基本情况
ISSN0098-79130953-15131198-9742
总被引频次
14219180
2011年影响因子1.0480.8870.628
5年平均影响因子(2011)
0.8520.6900.584
刊名缩写SerialsRevLearnPublJScholarlyPubl
2结果
我们对纳入的3种期刊在2008至2012年发表论文的参
考文献进行统计分析,得到了被引次数高于4次的35篇论文(表2)。对这些高被引论文进行同被引聚类分析,得到聚类结果(图1)。汇总分析如下。
表2
序号1
[***********][***********][***********]333435
学术出版领域近5年来的高被引论文
关键字段
TenopirC.,2000,ELECTJREALITIESSCGERMANOW,2005,DISSERTATIONBOOKRowlandsI.,2005,NEWJPUBLISHINGMODBelcherWendy,2009,WRITINGYOURJARTIC
AndersonR,2003,LIBRCOLLECTACQUIS,V27,P61SwanA,2005,OPENACCESSSELFARC
GarfieldE,2006,JAMA-JAMMEDASSOC,V295,P90KingDW,2009,LEARNPUBL,V22,P126
ROWLANDSI,2004,SCHOLARLYCOMMUNICATTenopirC,2003,USEUSERSELECTLIBSilviaP.J.,2007,WRITELOTPRACTICAL
DavisPM,2006,JAMSOCINFSCITEC,V57,P1243HirschJE,2005,PNATLACADSCIUSA,V102,P16569HamesI.,2007,PEERREVMANUSCRIPT
BROWNLAURA,2007,UPUBLISHINGDIGITALMorrisS,2007,LEARNPUBL,V20,P299
AntelmanK,2004,COLLRESLIBR,V65,P372BjorkBo-Christian,2006,LEARNPUBL,V19,P147PETERSDP,1982,BEHAVBRAINSCI,V5,P187[Anonymous],DIRECTORYOPENACCESGARFIELDE,1955,SCIENCE,V122,P108
DaltonMS,2008,JSCHOLARLYPUBL,V39,P197MeadowsAJ,1998,COMMUNICATINGRESCraigID,2007,JINFORMETR,V1,P239LucyBeth,2008,REVISINGYOURDISSER
HoughtonJ.W.,2009,ECIMPLICATIONSALTEHahnK.L.,2008,RESLIBPUBLISHINGSNicholasD,2006,JDOC,V62,P482ShalviS,2010,LEARNPUBL,V23,P117SeglenPO,1997,BRITMEDJ,V314,P498BorgmanCL,2007,SCHOLARSHIPDIGITALTenopirC,2009,ASLIBPROC,V61,P5AdamD,2002,NATURE,V415,P726BankierJG,2008,SERIALSREV,V34,P21TenopirC,2009,LIBRINFORMSCIRES,V31,P139
被引频次[***********][***********]
图1
学术出版领域高被引论文同被引双聚类分析结果
最左侧的聚类树图表示的是35篇高被引论文,对应其最右侧是这些论文的信息,最上面一行则是对应的引用高被引论文的论文,图中的黑色区域表明了这些左边的高被引论文被上面的哪些论文引用2.1
科技写作实践与修辞学
作为最基本的技能之一,论文的写作技巧一直是初级科技人员培养内容之一,所以很多科技期刊有涉及这方面的教程推荐或技术支持。近5年这部分的重要进展值得一提的
[6]
文献有RobertBrown的论著,作为一篇文笔顺畅的修辞学
方面的文献,该研究的实践价值也很高,该作者比较了人文和社会科学领域的6篇毕业论文和相关6本书的类似段落,观察毕业论文到专著的文辞演变。其目的是将文字修改方青年教师和毕业生,指导他们如面的经验传授给科技编辑、
何将这些分散的文字组织成为个人的专著。
其他的进展为StevenEGump发表在JournalofScholarlyStevenPublishing的3篇书评[7-9]。在2009年发表的书评中,EGump描述这本旨在帮助辅助领域作者进行论文写作和出版的科技论文出版的实践技巧的书。该书精巧、实用,可作非常适合在社会服务和辅为学术论文出版的一个初级读本,
2013,24(6)中国科技期刊研究,
http://cjstp.ijournals.cn
—1045—
助性行业工作的学者们和实习者,比如从事社会工作、教育、护士、咨询、心理学、公共行政和刑事司法的工作人员。为体Furman行文谨慎,现作者的真知远见,把著作分成8章,并附1个结论和6个附录。上述内容的设置都围绕有9个练习,
学者们要求在学术期刊发表论文的信息和想法展开,实践性可见一斑。StevenEGump2010年发表的书评从题目来看,——学术出版成功的更具有指南性质:期刊论文写作12周—
指南。StevenEGump提到,该书是一本全面的工作手册,可以让人文和社会科学领域的毕业生和大学初级教员在短期将他们的作品在同行评议的期刊发内提升自己的写作能力,
表。2011年StevenEGump做了一本关于学术论文写作和出该书的作者Clarke认为学术版社会学研究方面专著的点评,
它存在于社会背景下。在这种写作最终不会是独立的行为,
环境下,我们应如何进行学术生产和分享研究成果。2.2
机构存储与出版
作为学术产出的重要基地,学术机构还承担一项重要的即实现学术数据和成果的保存和交流。在本研究中,任务,
我们遴选了4篇重要的研究结果与大家分享。
Jean-GabrielBankiera和IrenePercialib在2008年的一篇文献中
[10]
同时建议图书馆出版能具有多样性。构建的机构集合模式,
在探讨学协会与出版伙伴的关系上,首先我们知道学协会的出版计划是任务驱动型的,他们在基金资助和传播研究但从本质上来说,那些资金量小且限中起到了独特的作用,
制使用的资源,容易扰乱当前的学术出版。在这方面,AshmanPeter为我们带来了一些思考[13],BMJ期刊本身是个学会出版商,但也是跟其他学会签约的出版商。在2008年,作者调研了学会对他们出版合作方的需求。当前学协会出版经营能力下滑的一个威胁来自于学者们不断变化的期待和行为。学协会正努力拓展开发专业方面的活动,最大程度地利用现有技术来维持和发展会员。虽然在选择合作伙伴学协会首先会看重声誉、技术创新和发展的回报,将的时候,
但对于出版项目来说,一个高经赢利能力放在最低的位置,济回报也是一个重要的标准。2.3
开放获取与同行评议
自20世纪90年代末,国际学术界、出版界、信息传播界OA的进展和成就和图书情报界大规模兴起OA运动以来,
一直举世瞩目。对其的讨论也不绝于耳。但目前学术界,尤其是读者和作者对其的认知和认可如何,还有待观察。2009
[14]
年LearnedPublishing上发表的一项研究调查了35个英国
再次探究了大学在机构存储中的作用,面对开放
获取(OA)出版,大学还能做什么?作者指出,自OA运动蓬勃发展开始,大学一直是OA出版的一个重要参与者,但由这条绿色通道不断面临着挑于作者上传文档的质量问题,
战。如今面对着机遇带来的独特机会,大学应该重新改造和鼓励机构存储模式。该文作者讨论了在与研究者交流机构存储时哪些方式是不可行的,以及如何让我们更好地满足学校教职员工的需求。作者认为机构存储不仅仅是个简单的它也是研究者发表的优秀学术作品的陈列室,在OA档案库,
期刊中出版的原始成果的一个平台。
来自香港的DianaLHChan在2009年报道了香港高等教育机构仓储的发展战略、挑战和方向
[11]
学术团体的会员对OA的态度,回复1368位,大部分回复者并支持OA期刊。66%的调查者读过OA期刊,知晓OA,
25%在其中发表过文章,但这2项提到的期刊有三分之二不是OA期刊。大部分回复者认可OA期刊可提高研究的获得但他们也关切OA收取读者费用的问题,学术质量可能性,
下降的问题,及其对已有期刊、出版商和学术团体的负面影响。相反,不到一半的调查者知道什么是自存储,只有36%50%对此不敢确定。对于自存储的利用和知晓率相对支持,
较低。虽然他们对于自存储的便利性和获取性是确定的,但读者和机构的工作负担、版本的混乱扩散,对对于质量控制、
已有期刊、出版商和学会的潜在损害还是有顾虑。
JI-HONGPARK的一项研究了解了科学家实现基于网
[15]
认为他们了解OA的益处。作者认站学术出版的动机,
。该研究整合了
这些机构存储的规模、内容、全文和公众开放性。该文也比较了在香港大学教育资助委员会注册的仓储的容量和研究毕的产量。发现存储作品的比例中期刊和会议的论文较少,业论文的比例中等。这些存储率反映了不同机构的存储策略。香港开放获取委员会在认识到这些挑战后,被告知需要解决知识分享中的区域问题。
XiaJing-feng在2009年的JSP中探讨了图书馆出版在学术交流中的新模式
[12]
虽然OA期刊可以让研究成果得以更高的显示和更广泛为,
的交流,受到各方的鼓励,但没有证据表明与之相关的益处。尽管出现了很多关于OA作用的争议,我们还未能很好的了作者设计了一个基于web的解学者关于OA的观念。为此,
问卷调查,发放给全球的1104位学者,以了解学者们通过OA路径的进行出版的情况及其动机。数据显示定义的11个相关动机因素明显的影响了他们进行OA出版的意图。社会影响和学科相关性的因素不是很重要,但对待OA的态
。该文首先简要地比较了图书馆出
现行实践及其趋势,通过介绍某些国版和机构存储的历史、
外大学出版模式,作者建议图书馆应建立一个不以学科方向—1046—
http://cjstp.ijournals.cn
2013,24(6)中国科技期刊研究,
度不同程度地依赖于调查者是否授予了终身职务。
SouderLawrence等[16]总结了关于同在同行评议方面,
行评议的研究和评论的文献集合,试图追踪出现在同行评议编者、评审员和读者)间不同的伦系统中关键参与者(作者、
理学问题。这些问题包括:偏移、恩惠、利益冲突、重复发表、诚实、透明和训练。他认为,关于这些争论(比如开放还是盲审)还不能解决,但新技术为解决老问题提供了前景,即使他们也会出现新的挑战。
BorgmanChristineL等[17]提到了数据的重要性,认为数据正在成为学术的重要产品,成为期刊论文和书的重要补充。研究数据可用来解答新问题、重复工作及核实研究成这跟果。数据的类型和应用在各学科领域间有很大的不同,技术、出版物的在线获得能力和激励机制有关。作者指出,政策和机构组建都已成熟,下一步是如何整合他们。在公共以数存储中创建一个与出版商数据集进行互链的大数据集,字形式保持和维护学术记录是最有前途的解决方案。2.4
科技期刊自引与质量控制
国内期刊的自引问题一直是个较为敏感的话题,前些年有个别国内期刊恶意提升自引率,从而提升期刊的影响因受到了国内外同行的一致反对,部分期刊受到了惩罚。子,
但这些问题是否还存在,目前自引的情况如何?国内有二项Li和WangMei-Ying对于中研究可以参考,其一是LiuXue-文生物医学期刊的自引期刊的调查
[18]
RegazziJohnJ和AytacSelenay等[20]调查了作者认知的STM期刊质量的特点。该研究对纽约长岛大学全职教职员自愿者进行了以下3种方式的调研:(1)问卷调查;(2)分组讨对于期刊质论;(3)半开放式的面对面访谈。最终结果显示,
量的把握最为重要的3个属性是期刊的声誉、出版时滞和读者对象。
经济衰退是当前学术期刊危机再现的一个原因,而商业出版商的利润兜售再次受到抨击,称其为这场危机的驱动力。但数据分析并未发现最近几年中存在过多的公司贪腐真正的问题来自于学术图书馆的经费预算不足和以简现象,
单方式评估教职工能力的出版狂潮。为防止在接下来的几PhilippeCBaveye[21]提醒大学不发生类似的出版海啸,年里,
必须找到在和研究所务必要将出版活动的重心从量转到质,
生产力和影响力评价标准中引入同行评议。为实现这个目需要研究者、图书管理员和出版商的齐心协力。的,2.5
新阅读模式和新技术
BlancaRodríguezBravo和MaLuisaAlviteDíez对西班牙的学术电子期刊进行了分析
[22]
,以了解5家西班牙大学学
术团体的消费模式,也就是了解5家学术团体对2010年开始订阅的4大主要电子期刊提供商内容的使用情况。同时,作者基于里昂和比戈的西班牙大学的数据创建了一个初步方法来评估这些电子期刊的投资价值。
另一来自西班牙的研究
[23]
。他们对884种中国也探讨了西班牙大学图书馆
96生物医学期刊的自引率进行了调查,其中185种综合性、103种中医类、66种基础医学类、370种临床种预防医学类、
医学和64种药学类期刊。在调查的2005~2007年间有逐年下降趋势,不同学科间自引率有所差异。2007年52种中文他们的总被引频次和影响因生物医学期刊未出现自引现象,
子分别为263和0.206,这比2007年所有统计期刊的平均值在2005~要低。自引率超过上限的被称为过度自引期刊,2007年分别有62(7.01%)、68(7.69%)和66(7.47%)种被定义为过度自引期刊。然而,一定数量的自引是合理而必须的。
XiaXiao-dong和WuYa-wen等[19]对国内某些中此外,
文科技期刊的自引情况进行了分析。该研究对7个领域中的222种中文期刊的自引率进行了调研,包括农学、生物学、环境科学与技术、林学、农业大学的学术期刊、水产科学和13种畜牧兽医学。大部分学科领域间期刊自引率之间有显著差异。文章也讨论了自引率与期刊影响因子之间的关系。
如今学术团体面临的一个重要问题是研究结果出版和传播中的质量控制。关于作者对期刊质量的认知方面,
http://cjstp.ijournals.cn
电子期刊的利用模式。该研究对西班牙西北地区6所学术图书馆对订阅的2002~2005年间的电子期刊的应用情况进行了分析,提出了大学使用这些期刊的模式和这些内容分布的特点。
关于学术期刊和书籍阅读新模式的调查,英国的一项传统研究可以给我们些启示
[24]
。该研究对英国6所大学的学
以便于出版商了解学术论文和书籍阅读术人员进行了调查,
模式,结果显示图书馆馆藏的电子期刊是学术期刊阅读的重要来源。书的阅读模式不同于论文,大部分为个人的纸质收因此便利性和方便藏品。学者们每天接触不同来源的信息,获取是重要的因素。
BennettClairePonsford等[25]在论文阅读的新技术方面,
“参考文献链接器”研发的ExLibris'SFX?的可能为学者的引文查询和链接带来便利。许多OpenURL链接解析器提供了参考文献寻找服务,让终端用户在论文层面检索特殊的已“参考文献链接知字段。该文作者研究了ExLibris'SFX?的
to-Z表的检索功能,并邀请21位志愿者来比较标准的A-器”
与SFX参考文献链接器搜索在检索期刊论文的功能。
—1047—
2013,24(6)中国科技期刊研究,
3讨论
文献是科学研究的记录,文献计量学方法一直是分析学
8GumpSE.Writingyourjournalarticlein12weeks:aguideto2010,41(2):246-252academicpublishingsuccess.JSchPub,
9GumpSE.Asociologicalstudyofscholarlywritingandpublishing:howacademicsproduceandsharetheirresearch(review).JSch2011,43:127-132Pub,
科专业研究结构和趋势的重要手段。如果一篇论文被某学科专业的其他论文引用频次越多,说明该论文是研究活动中不可或缺的工具和基础;两篇论文如果频繁地被其他论文同时引用,则说明它们之间存在着内容的关联。根据“物以类聚,人以群分”的思想,聚类分析算法是通过两篇高被引论文被同时引用的多寡来表现其相关性,由此把这些论文加以分类,形成各专业发展的知识基础。在以此为基础,我们从2008~2011年发表论文中找到与之关系最为密切的论文,如同从树根寻找到新芽,展现出研究的最新进展,这就是我们要寻找和表现的研究前沿。
我们从中发现了5大研究前沿,分别为科技写作实践与修辞学、机构存储与出版、开放获取与同行评议、科技期刊自引与质量控制和新阅读模式和新技术。从笔者的经验来判断,此5项研究确实在目前的科技出版界比较热,讨论的也比较多。说明该方法有一定的科学性,取得的研究进展值得关注。我们也选择最具代表性的文献进行展开叙述以期了解研究者的发现和观点,以飨读者。
但囿于目前数据处理技术的限制,本研究选取了5年中发表的文献记录,仅仅显示了一个时间横断面上的静态的状况,如果想要了解这些学科的动态变化及趋势,应当在今后定期跟踪这些热点和前沿。参考文献
1
陈仕吉.科学研究前沿探测方法综述.现代图书情报技术,2009,(9):28-332
PerssonO.TheintellectualbaseandresearchfrontsofJASIS1986-1994,45(1):31-381990.JAMSOCINFSCITEC,3
RasmussenM,KarypisGe.gCLUTO:Aninteractiveclustering,visualization,andanalysissystem.UMN-CSTR-04-021,2004.85865367.htmlhttp://www.docin.com/p-4
王璞,刘雪立,刘睿远.SSCI数据库中3种编辑出版类期刊的分2012,23(3):363-368析与评价.中国科技期刊研究,5
HirschJE.Anindextoquantifyanindividual’sscientificresearchoutput.PNACS,2005,102(46):16569-165726
BrownR.Manuscriptmakeovers:arhetoricalstudyofrevisionsmadetodissertationsturnedintobooks.JSchPub,2011,42(4):442-4757
GumpSE.Practicaltipsforpublishingscholarlyarticles:writingandpublishinginthehelpingprofessions.JSchPub,2009,40(2):212-217
[***********]1413121110
BankieraJG,PercialibI.Theinstitutionalrepositoryrediscovered:whatcanauniversitydoforopenaccesspublishing?SerialsReview,2008,34(1):21-26
DianaLH.AnintegrativeviewoftheinstitutionalrepositoriesinHongKong:strategiesandchallenges.SerialsReview,2009,35(3):119-124
XiaJingfeng.Librarypublishingasanewmodelofscholarlycommunication.JSchPub,2009,40(4):370-383
PeterA.Whatsocietieswantfromapublishingpartner.Learned2009,22(3):209-219Publishing,
SallyM,SueT.Learnedsocietymembersandopenaccess.Learned2009,22(3):221-239Publishing,ParkJH.
Motivationsforweb-basedscholarlypublishing:
do
scientistsrecognizeopenavailabilityasanadvantage.JSchPub,2009,40(4):343-369
LawrenceS.Theethicsofscholarlypeerreview:areviewoftheliterature.LearnedPublishing,2011,24(1):55-7217
ChristineBL.Data,disciplines,andscholarlypublishing.LearnedPublishing,2008,21(1):29-3818
LiuXL,WangMY.Self-citationinChinesebiomedicaljournals.LearnedPublishing,2010,23(2):93-100
XiaXD,WuYW.Journalself-citationanalysisofsomeChineseSci-techperiodicals.SerialsReview,2011,37(3):171-173JohnRJ,SelenayA.Authorperceptionsofjournalquality.LearnedPublishing,2008,21(3):225-235
BaveyePC.Stickershockandloomingtsunami:thehighcostofacademicserials(2):191-215
BravoBR,DíezMLA.AnanalysisoftheelectronicjournalsinaSpanishacademiccontext:developmentsandprofitability.SerialsReview,2011,37(3):181-195
BravoBR,DíezMLA,AlmuzaraLB,etal.Patternsofuseofelectronicjournalsinspanishuniversitylibraries.SerialsReview,2008,34(2):115-128
CarolT,RachelV,DonaldKW.Articleandbookreadingpatternsofscholars:findingforpublishers.LearnedPublishing,2012,25(4):279-291
PonsfordBC.Findingknownjournalarticles:compringacitation2011,37(2):93-98linkertoanA-to-ZList.SerialsReview,
in
perspective.
J
Sch
Pub,2010,41
—1048—
http://cjstp.ijournals.cn2013,24(6)中国科技期刊研究,