对数据仓库文献的定量分析
科技情报开发与经济
文章编号:1005-6033(2008)01-0079-05
SCI-TECHINFORMATIONDEVELOPMENT&ECONOMY2008年第18卷第1期
收稿日期:2007-10-20
对数据仓库文献的定量分析
闫苗苗,华薇娜
(南京大学信息管理学院,江苏南京,210093)
摘
要:从5个方面对SCI/SSCI/A&HCI中1985—2006年间的有关数据仓库研究的文
献进行了分析,探讨了数据仓库的发展。
关键词:数据仓库文献;定量分析;核心作者;核心期刊中图分类号:G250.74
文献标识码:A
(DataWarehouse,简称DW)技术出现在20世纪80年代中数据仓库
集成的、随时间变化的、非易失性数据的集合,期,它是一种面向主题的、
其目的在于支持管理层的决策。“数据仓库”WHInmon在1991年提出了“一个用以更好地支持企业或组织的决策分析处理的、的概念,其定义是
面向主题的、集成的、不可更新的、随时间不断变化的数据集合。”
本文以WebofScience中3个引文数据库(SCI/SSCI/A&HCI)为文献来源来研究数据仓库的发展状况。本文按照文献数量、地区和机构、著普通高校教育和成人高等教育的关系,充分释放高校图书馆教育资源的
]4
随着计算机技术的广泛应用,许多商业企业已保存了大量原始数据和各种业务数据,这些数据真实反映了商业企业主体和各种业务环境的经济动态,但很难获得有效利用。这是因为不同类型的数据处理有着不同的处理特点,传统的信息处理方式都是以单一的数据为中心的事物处理,不能反映这种差异。尤其是当以业务处理为主的联机事物处理应用与以分析处理为主的决策支持系统应用共存于一个数据库系统中时,这两种类型的处理发生明显的冲突,数据仓库技术也就应运而生。高成人教育的质量有着深远的意义[
]
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!2
。
潜能[
2高校图书馆在成人教育服务中存在的问题
教育部颁布的《普通高等学校函授教育暂行工作条例》中明确规定:
。图书馆工作人员首先要从思想上认识到成人学员利用图书馆的
重要意义,增强主动服务意识,拓宽服务领域,为成人学员营造良好的阅读氛围。应当充分利用现代信息技术,提供高质量的、经过图书馆员精心分析成人学员的特点和阅读加工的文献信息资源。其次,还要深入了解、
需求,采取有针对性的措施,最大限度地满足成人学员对文献信息资源的需求。
(2)适当调整馆藏结构,充实成人教育相应的文献资料。要将成人教育作为一项与全日制普通教育同等重要的内容,拨付足够的经费及时采购成人学员急需的、实用性强的文献资料,日积月累,逐步形成规模,使成人学员与全日制学生一样能充分享用学校的文献信息资源。图书馆应根据成人教育的教学大纲体系、专业设置、课程安排等对藏书建设进行统筹协调,尽可能提供齐备的文献信息资料,为成人学员课堂之外的自学解决“后顾之忧”。
(3)将成人教育工作纳入图书馆工作范畴,开设文献检索课程,培养学员自主获取信息的能力。在信息时代的今天,网络信息技术的应用非常普遍,但部分成人学员对如何利用检索工具查询资料还相当生疏,掌握一定的文献检索知识和技能对他们来说尤为重要。图书馆应充分发挥其教育的职能,安排经验丰富的教师对成人学员进行信息素质教育。通过文献检索课或讲座形式引导成人学员正确利用图书馆资源和网络资源,形成通过图书馆和网络解决问题、丰富知识、提高能力的意识,激发成人学员利用图书馆和网络等各种途径获取信息资源的愿望,培养学员自主获取信息的能力。这其实也是图书馆的重要职责之一。
参考文献
[1][2][3][4]
李群,陈海红.高校图书资源与成人自助学习[J].陕西师范大学继张双莲.高校图书馆服务于函授教育的几点思考[J].高等函授学赵素媛.浅议图书馆在继续教育中的功能作用[J].中华医学图书情王育茜,林燕.高校图书资源如何服务成人教育[J].河北工业大学
(责任编辑:邱娅男)
(1):27.续教育学报,2004报,2005(3):14.报杂志,2003(2):20.
成人教育学院学报,2002(1):29.
“函授生按照教学计划要求,在校集中学习期间,学校应统筹安排其使用教室、实验室、阅览室、图书馆、学生宿舍以及其他教学、生活设施。”此条例明确指出了图书馆在成人函授教育中的地位和作用。但至今为止,高校图书馆服务成人继续教育的现况却不尽如人意,主要表现在以下一些方面。
(1)对图书馆在继续教育中的重要性和作用缺乏足够的认识。传统观念认为,继续教育学员只是为了提高学历、拿到更高一级的文凭才参加学习,对于能否学到实用的知识并不看重。事实上,随着知识经济时代和信息时代的来临,人们越来越重视通过各种方式的继续教育来提高个人素质。高校图书馆的信息资源是成人学员汲取知识营养的重要来源,图书馆具有其他场所不可替代的功能。但大多数高校图书馆缺乏开展成人继续教育工作应有的积极性,没有把图书馆当作成人继续教育的重要场所,也没有采取相应的措施进行此项工作,从而在一定程度上影响了继续教育的开展[
]3
。
(2)图书馆在开展成人继续教育服务过程中形式单一,组织力度欠缺。图书馆一般只提供单一的图书借阅服务,没有对成人继续教育所需信息资源进行深度开发、加工和整理,也没有对成人学员进行文献检索知识等方面的培训,导致成人学员缺乏查找文献资料的方式方法,对图书馆规章制度、馆藏资源等知之甚少,图书馆意识淡薄,不懂得利用图书馆去获取有价值的信息。
(3)图书馆在经费上得不到保障,用于继续教育的经费投入相当有限。经费的紧张导致图书馆工作人员在文献采访时,只偏重于全日制普通教育,没有购进一些针对性强,适合于成人学员的参考资料。众所周知,成人学员的学习一般是集中几天时间由教师授课,课堂之外主要是依靠自学。能否查找到齐备的学习参考资料来帮助他们更好地吸收、消化、巩固所学知识,并且辅助完成作业,对成人学员来讲是十分重要的。“杯水车薪”,成人但据了解,大部分高校用于继续教育的经费可以说是学员要想在图书馆查找到实用完备的文献资料并非易事。
3高校图书馆开展成人教育服务的措施
(1)转变观念,在为全日制普通教育服务的同时也应积极为成人继
───────────────
第一作者简介:陆金凤,女,1977年11月生,2003年毕业于中山大学,助理馆员,韶关学院政治与公共管理系,广东省韶关市,512005.
(下转第103页)
续教育服务。作为文献信息中心的高校图书馆要适应社会需要,处理好
79
者、期刊、主题等特征对调研样本进行统计分析,以便于人们了解数据仓库的研究现状。
国别
表2按第一著者所在国家统计的文献量所占百分比/%
国别智利瑞士新西兰匈牙利立陶宛土耳其以色列爱沙尼亚巴基斯坦冰岛波多黎各俄国菲律宾共和国
芬兰罗马尼亚马来群岛挪威塞尔维亚沙特阿拉伯斯洛伐克伊拉克其他
文献数量所占百分
文献数量
1文献数量分析
本文在检索时段上选取了到2006年止所有的数据,用主题“TS=
/篇3298564393231292727242323161611109877765
/篇54432221111111111111140
比/%
美国中国德国法国英国意大利澳大利亚加拿大西班牙韩国希腊新加坡奥地利
35.79.236.954.233.473.373.152.932.932.612.502.501.741.741.191.090.980.870.760.760.760.650.54
0.540.540.430.330.220.220.220.110.110.110.110.110.110.110.110.110.110.110.110.110.114.34
(warehous*SAMEdata)”进行文献检索,用于对有关数据仓库的文献总量及分布情况等进行统计分析,共检索到921篇(其中收录了2007年2篇)相关文献。图1为各年有关数据仓库发表文献数量的增长情况。表1为各年数据仓库发表文献的数量。
140
120100806040200
发文量/篇
198519911993199519971999200120032005
图1表1
各年文献的增长情况
波兰巴西葡萄牙日本印度比利时丹麦荷兰南斯拉夫共和国瑞典
各年数据仓库发表文献的数量
年份19961997199819992000200120022003200420052006
23
43
56
85
96
93
118108127132
文献量/篇20
从图1提供的数据可以看出:
(1)从1985—1995年是数据仓库技术研究的前期,这一时期发表的文献量不是很多,合计18篇。但是这一时期对于数据仓库技术的研究奠定了数据仓库发展的基础,“datawarehouse”的定义以及数据仓库的构建等方法就是在这一时期提出的,其中还有少量文章涉及数据仓库技术在档案工作、环境等方面应用的文章。
(2)从1996年开始,文献数量出现明显的增长趋势,说明数据仓库已经在一定范围内引起了国内外研究者的兴趣,越来越多的人加入到对数据仓库的研究中,数据仓库作为一种新型的信息管理技术是现代计算机应用领域里的一个新方向。总体来看,从1985—2006年有关数据仓库的文献数量基本呈增长趋势,尤其是以1996年为转折点,数据仓库行业《数据仓库工具箱》第1版(Wiley出版)以自1996年RalphKimball发表
来,已经逐步走向成熟,数据仓库技术开始被各种规模的机构所使用,维度建模方法作为展示数据仓库的主导技术被广泛地接受,由此研究数据仓库技术的有关文献大幅增加。
(3)从2003—2006年文献量增长情况看,数据仓库的研究已经基本平稳,文献量占总数量的1/2,但2004年稍有减少,这可能与数据库的收录等其他情况有关。数据仓库在今后一段时间还会继续有所发展。
Munster,DepartmentofInformatSystem等机构作的贡献。
我国也是数据仓库研究较为领先的国家之一。在各国发表文献数量中,中国文献数量85篇,居第二位。其中,我国大陆地区发表文献32篇,香港地区发表文献23篇,台湾地区发表文献30篇。总体来看,我国大陆地区文献分布比较分散,在收录的32篇文章中,哈尔滨工业大学的计算机科学与技术学院发表文章5篇,复旦大学4篇,武汉大学3篇,中国科学院3篇。此外,北京大学、华中科技大学、清华大学等高校的文章也均被收录。香港地区文献分布则相对集中。香港地区的香港工艺大学8篇、香港科技大学4篇、香港大学4篇,香港城市大学4篇,4所高校的发文量占香港地区发文量的87%。台湾地区的文献分布较为居中,收录了17所高校的30篇文章,平均每所高校发文量1.76篇。其中发文量较多的高校,如:台湾国立中央大学3篇、国立交通大学4篇、国立中正大学4篇、国立高雄第一科技大学3篇。哈尔滨工业大学发表的5篇文章中李建中教授以第一著者身份发表文章3篇、第二著者身份发表文章1篇。这5篇文章发表年度为
2地区与机构分析
由于存在大量同一国家著者合作的文献,为了不产生重复数据,本
2000—2005年,而哈尔滨工业大学计算机科学与技术学院自2000年以来承担各类科研项目220项,包括国家自然科学基金项目(含重点项目2项)、国家863计划32项(含重点项目5项)、国防科技公关重点项目2项、国家信息安全重大工程36项(含重大项目6项)、国防预研项目9项(含重点项目2项)、国防型号项目1项、教育部跨世纪优秀人才基金2项、奥运重点科技公关项目1项、省科技公关重大/重点项目6项、其他省部委基金项目8项、国际合作项目16项,众多的科研项目是使哈尔滨工业大学在数据仓库方面研究的文献量为我国大陆地区最多的原因之一。
本文收集的文献样本共涉及44个国家和地区,既包括欧美等发达国家,也包括中国、印度、菲律宾等发展中国家,由此可见,数据仓库的研究受到了世界范围内研究者的极大关注。
以上对第一著者所在国家进行的统计只能大致反映出各国的研究状况,为了进一步弄清世界上主要的研究结构以及它们之间的合作关系,本文对著者所在机构进行了统计分析。排除同一个机构内的合作情况,仅发表3篇以上论文的机构就有79所,而发表10篇以上论文的机构有18所,本文就发表论文较多的前6所机构进行统计分析,其具体数据见表3。
文对921篇文章按照第一著者所在国家进行了地区统计(见表2)。
表2的数据说明:在数据仓库研究方面,美国明显处于领先地位。美国发表的文献总数达到329篇,占样本文献总量的1/3以上。根据进一步的分析可以发现,在数据仓库兴起的初期,美国在数据仓库领域有许多领军人物。数据仓库之父BillInmon在1991年提出的“datawarehouse”的概念至今影响深远。并且,SteveHoberman,RalphKimball,John
Zachman,RichardHackathorn等的人作品也被后来许多的研究者引用。在美国,数据仓库已成为紧跟Internet之后处于第二位的技术热点。此外,本文所选用的数据库WebofScience由美国的数据库生产商
ThomsonScientific所建立的,这也可能是造成美国发表的文献总数明显领先的原因之一。
欧洲发表的文献量仅次于美国,同时也占样本文献总量的1/3以上。欧洲各国几乎都有研究者参与数据仓库方面的研究,其中又以德国的文献数量遥遥领先,这要归功于德TheUniversityofLeipzig,Department
ofComputerScience,RheinWestfalTHAachen和TheUniversityof
80
表3发表15篇以上论文的机构统计机构名称
文献量/篇
表5全部著者中发表9篇以上论文著者统计
著者所属机构
西班牙阿利坎特大学计算机科学学院新加坡南洋科技大学应用科学学院新加坡南洋科技大学应用科学学院希腊Zographou,Athens希腊国立科技大学
计算机科学系西班牙阿利坎特大学
美国CalifSantaBarbara大学计算机科学系美国CalifSantaBarbara大学计算机科学系
新加坡南洋科技大学应用科学学院美国密苏里州大学计算机科学系
西班牙:阿利坎特大学计算机系统和软件学院新加坡:南洋科技大学计算机工程学院美国:IBM公司
美国:夏洛特敦维吉尼亚大学医学院健康评估科学系美国:爱荷华州州立大学计算机科学系
希腊:雅典,NatlTechUnivAthens,DivCompSci,Dept
232121181515
论文量/篇著者姓名
191613131099999
JuanTrujilloWeeKeongNgSSBhowmickPVassiliadisSLujanMoraDAgrawalAElAbbadiEe-PengLimSMadria
Elect&CompEngn
表3中列出的都是数据仓库研究领域的主要机构,其中IBM公司“数据仓库构架”1991年正式宣布了的,在信息产业界引起很大轰动。IBM公司对数据仓库技术进行了一系列研究,并提供了一套基于可视数据仓(BusinessIntelligence)解决方案,包括:VisualWarehouse库的商业智能
(VW),Essbase/DB2OLAPServer5.0,IBMDB2UDB,以及来自第三方的前端数据展现工具和数据挖掘工具等技术。其中,VW是一个功能很强的集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取、转换、装载和调度。Essbase/DB2OLAPServer支持“维”的定义和数据装载。Essbase/DB2OLAPServer不是ROLAP(RelationalOLAP)服务器,而是一个(ROLAP和MOLAP)混合的HOLAP服务器,在Essbase完成数据装载后,数据存放在系统指定的DB2UDB数据库中。本文收集的样本文献中就涉及了此一系列的文章,如AnapproachtoenablingspatialOLAP
EARundensteiner美国WorcesterPolytechInst计算机科学系
坎特大学计算机科学学院。同样核心著者WeeKeongNg,SSBhowmick和Ee-PengLim所属机构则是新加坡南洋科技大学应用科学学院Ctr
AdvInformatSys。这说明表5中的核心著者也就是表4中核心机构的代表人物。
(2)JuanTrujillo无疑是数据仓库研究领域的领军人物,样本文献中他在1985年就和JJZubcoff写了有关数据仓库方面的文章,之后两人在他也是和其他研究者合作最多的著1988年又就此进行了进一步的研究。
者,合作的范围非常广泛。JuanTrujillo和SLujanMora合作过多次,智利的RVillarroel也与他合作过。
(3)SSBhowmick,WeeKeongNg和Ee-PengLim都可以称作是目前数据仓库研究的重要人物,他们之间更是频繁合作,在2006年3人就数据仓库与商业智能方面发表了一系列的文章。
byaggregatingonspatialhierarchy,TheapproachfordatawarehousetoansweringspatialOLAPqueries和Processdatastore:Areal-timedatastoreformonitoringbusinessprocesses等文章。
3著者分析
表4是对各个研究机构的核心作者及代表人物的总体分析。
表4著者统计全部著者数/人
篇均著者数/人
独立著者数/人
第一著者数/人
4期刊分析
本文所检索的921篇样本文献分布于352种不同的期刊,对这些期
3篇以上论文著者数/人
刊进行分析,可以确定该领域的核心期刊,为读者重点阅读提供指导,同时也有助于该领域内研究人员彼此交流、互相学习。关于数据仓库的研究的文献的352种期刊,把载文量较高以上的期刊界定为核心期刊(见表6)。
表6
发表10篇以上论文的期刊统计期刊名称
论文量/篇
28363.0813092139
表4中:“全部著者数”是指被统计文献的所有著者,包括合著者;“独立著者数”是指独立完成论文的著者数,一人发表多篇论文时不重复计算;“3篇以上论文著者数”是指第一著者中发表3篇以上论文的著者,这一数字已计入第一著者数中。由表4的数据可以得到如下结论:
(1)篇均著者数3.08人说明合作研究比较多,可能是研究机构相对较集中,同事之间的合作比较多的原因。此外,进一步分析可以发现,数据仓库的研究出现越来越多跨行业、跨地区的合作。由此我们可以看出,数据仓库的研究是和计算机、图书馆、医学等学科密不可分的,各研究领域相互交叉,互相影响、互相促进。但同时以第一著者身份发表3篇以上论文的著者有39人,其中发表5篇以上论文的著者有9人,更有著者发表论文量达13篇之多,说明在数据仓库研究领域已经出现了一些高产著者,他们奠定了该领域的研究基础。
(2)在921篇样本文献中(有11篇著者信息不可知),其中有130人是独立完成其研究的,比较显著的著者有:美国的ClaremontGraduate学院的PaulGray教授发表全部论文数量7篇,其中的6篇是其独立完成的。还有一些著者不仅独立发表论文数量较多,并且与他人的合作也十其中葡萄牙Coimbra大学的Pedro分活跃,也是值得关注的重要研究者。
DataWarehousingandKnowledgeDiscovery,ProceedingsJournalofAmericanMedicalInformaticsAssociationData&KnowledgeEngineeringInformationSystemsDecisionSupportSystems
IEEETransactionsonKnowledgeandDataEngineeringInformationSystemsManagementWirtschaftsinformatikDatamationSigmodRecord
65302522191818131312
以上几种期刊无疑是发表数据仓库及其相关技术研究成果的主要期刊,其中DataWarehousingandKnowledgeDiscovery,Proceedings是数据(Warehousingand仓库领域知名期刊,而国际会议数据仓库与知识发现
Furtado教授独立发表论文4篇,与他人合作的研究成果还有3篇;还有希腊的Natl科技大学的TheodoratosD教授虽然独立发表论文3篇,但与他人合作的研究成果就有5篇之多。
由于对于数据仓库的研究存在比较多的合作现象,因此只统计第一著者数有失偏颇,在对全部著者发表论文数量的统计中发现:发表4篇以上论文数量的著者数就有67人,并且有20人发表7篇以上论文。表5是对全部著者中高产著者的统计。
由表5可以看出:
(1)核心著者统计与表4中核心机构的统计比较中可以看出,核心著者JuanTrujillo和SLujanMora所属机构则是核心机构西班牙的阿利
KnowledgeDiscovery)现已成为世界上最重要的国际科学活动,它汇集了研究者、地产商和企业人员的问题和经验,讨论最新的研究发展,部署数据仓库和知识发现系统的应用及其解决办法。期刊JournalofAmerican
MedicalInformaticsAssociation载文量较高原因可从数据仓库的主题分析中看到,有关数据仓库在医学方面的应用一直是数据仓库领域研究的重要方面。此外,期刊Data&KnowledgeEngineering和Information
Systems在数据仓库领域也有很高的权威性。
5主题分析
从微观角度对数据仓库文献的各主题进行分析统计,大致可分为数据
81
仓库体系结构研究、数据仓库相关技术、数据仓库技术应用、数据仓库其他讨论等四大类,其中每大类下有分为其他小类,具体数据统计见表7。
表7
论文主题统计
论文量/篇
baseddatawarehousing:Currentstatusandperspective。
(4)实化视图是数据仓库重要的技术之一。在数据仓库中采用实化视图进行快速查询和分析能有效提高查询速度和响应时间。数据仓库需要考虑的另一个重要问题的问题就是如何高效地维护实化视图,即视图维护。增量视图维护方面,斯坦福大学的YZhuge最先提出一种基于一个数据源的视图维护方法:ECA方法(EagerCompensation“补偿Algorithm)。这种方法基于FIFO模型,针对原始数据的变化构造请求”查询原始数据,并将查询结果反映在实视图中。接着,YZhuge又针对“Singleupdatetransaction”“Source-localtransaction”和“Global
主题类别
数据仓库体系结构研究
数据集成研究
(内部维护)数据存储和管理数据源研究前端数据访问工具
数据集市、元数据及数据立方体研究空间数据仓库、网络数据仓库研究数据仓库综述及其他体系研究数据仓库相关技术研究
数据清理与转换研究实化视图及视图维护研究数据仓库建设设计研究索引优化技术研究
数据仓库的存储与管理研究数据仓库相关算法及其他技术数据仓库技术的应用
决策支持系统及商业智能的应用研究有关知识发现、知识管理的应用研究数据仓库在生物学方面的应用研究数据仓库在医学方面的应用研究数据仓库在制药业、药物学的应用数据仓库在万维网方面的应用研究数据仓库在公共健康方面的应用研究数据仓库其他应用讨论数据仓库其他研究讨论由表7中数据我们可以了解到:
3444549148535387826412679662459248421423421010179065
transaction”3种数据源情况,提出一套Strobe算法,来维护多数据源情况下实视图的一致性,他的作品有Consistencyalgorithmsformulti-
sourcewarehouseviewmaintenance。视图选择方面,斯坦福大学的HGupta对基本视图结构提出了一个通用解决框架,并讨论了由它们构成的简单混合情况,他的研究作品有Selectionofviewstomaterializeina
datawarehouse,Thedatawarehouseofnewsgroups和Selectionofviewstomaterializeunderamaintenancecostconstraint。JYang则选择大部分视图可以“共享”的公共子视图进行实体化,他和JWidom合作撰写的
Temporalviewself-maintenance,Maintainingtemporalviewsovernon-temporalinformationsourcesfordatawarehousing等文章对此进行了研究。此外,香港Polytech大学的JLiu和JYou合作撰写的Materializedview
selectionandmaintenanceusingmulti-queryoptimization也讨论过此问题。
(5)数据仓库技术的应用。数据仓库技术应用到各个领域,因此有关数据仓库技术应用也占了样本文献的较大比重。其中数据仓库技术在临床医学、生物医学、生物基因、生物分子学等方面有较多论文研究;还有地理学、万维网、图书馆、社会健康、商业企业等各行业都有广泛的研究。在本文的样本文献中有关数据仓库应用方面的文章最早可追溯到1985年的Therecalledlawofprosecutioninpolicedatawarehouses。
6结语
数据仓库技术出现在20世纪80年代中期,从数据仓库技术研究的
(1)数据仓库体系结构的研究占样本文献的37.35%,在众多高校和研究所对数据仓库的研究中,斯坦福大学的数据仓库计划处于领先地位,他们提出了一种有普遍代表性的数据仓库体系结构,并且围绕这个体系结构的各个环节,开展了深入的研究工作。他们进行了一个名为的科研项目,其研“WHIPS(WarehousingInformationProjectatStanford)”
究目标是要生成一个高效的、自动集成异构数据源的算法和工具。这个课题组已经提出了一个基本的数据仓库模型和一些相应的算法,代表性论文有斯坦福大学的YWCui撰写的Tracingthelineageofviewdataina
文献增长有明显的阶段性。前期的研究中数据仓库之父BillInmon在“datawarehouse”的概念激发了人们对数据仓库技术的研1991年提出的
究,使数据仓库研究文献出现了明显的增长高峰。此后,Steve
Hoberman、RalphKimball,JohnZachman,RichardHackathorn等的人作品也产生了深远的影响,同样也促使了美国在数据仓库技术方面的研究处于领先地位,在核心机构和核心著者的统计中都占有重要地位。
总的来看,目前数据仓库技术的研究已经处于成熟阶段,数据仓库作为信息管理的新型概念和技术也被越来越的国家企业接受,受到世界各地研究者的广泛关注。同时数据仓库思想也在不同的科学领域进行着延伸的,如空间数据仓库、网络数据仓库概念的提出,成为计算机应用领域里的一个崭新方向,也是目前的研究热点之一。
参考文献
[1][2][3][4]
佘春红.数据仓库及其相关技术综述[J].长江大学学报,2004,1(1):[M].王志海,译.北京:机械工业出版社,2000:5.InmonWH.数据仓库
杨蕾.LISA数据库中关于竞争情报的文献统计分析[J].情报理论与胡侃,夏绍玮.基于大型数据仓库的数据采掘:研究综述[J].软件学
(责任编辑:戚米莎)
warehousingenvironment和Lineagetracingforgeneraldatawarehousetransformations。
(2)前端数据访问工具是对数据仓库中的数据进行分析,挖掘其中的知识,将其转化为辅助决策信息。联机分析处理(On-LineAnalysis(DataMining)构成数据访问的主要工具。Processing,OLAP)和数据挖掘
多层次的概括和聚集、大量的商业转换和数OLAP技术通过交互式查询、
据计算以及借助于模型进行预测、趋势分析和统计分析,并以多维图表的形式给出结果;数据挖掘则是从大量的、具体的细节数据中发掘深层次的内容,它除了要用到统计分析工具以外,还要利用到知识发现技术,其代表性文章有西班牙阿利坎特大学的JNMazon和JTrujillo撰写的
23-27.
(3):256-259.实践,2003,26报,1998,9(1):53-63.
InteractivevisualizationforOLAP及美国的ClaremontGraduate学院的PaulGray教授连续发表了5篇有关数据挖掘方面的文章:AhierarchicalmodeltosupportKanseiminingprocess,Multiplecriterialinearprogrammingapproachtodatamining:Models,algorithmdesignsandsoftwaredevelopment,Dataminingatamajorbank:Lessonsfromalargemarketingapplication等。
(3)空间数据仓库和网络数据仓库的研究,空间数据仓库和网络数据仓库是近年来数据仓库思想在空间信息科学领域延伸的产物,这也是目前的研究热点之一。代表性论文有:西班牙的AAbelloA和JSamos撰写的Distributedspatialdatawarehouse及美国的SKTice撰写的Web-
───────────────
第一作者简介:闫苗苗,女,1982年12月生,现为南京大学信息管理系情报学专业2006级在读硕士研究生,江苏省南京市,210093.
82
科技情报开发与经济
(2008)01-0083-03文章编号:1005-6033
SCI-TECHINFORMATIONDEVELOPMENT&ECONOMY2008年第18卷第1期
收稿日期:2007-11-13
日本企业知识产权信息工作及其对我国企业的启示
魏
蕊
(河北大学管理学院,河北保定,071002)
摘
要:从3个方面介绍了日本企业知识产权信息工作的开展情况,并提出了我国企
业知识产权信息工作的构想。
关键词:日本企业;知识产权信息;中国企业中图分类号:G203
文献标识码:A
进和二次开发来实现技术学习,提高企业的核心竞争力;极其重视对知识产权信息的综合开发和利用,并通过知识产权信息取得了巨大的技术发展和市场开拓。因此,日本企业利用知识产权信息取得成功的经验很值得我国企业学习。
1知识产权信息工作对企业发展的重要性
一个国家经济的发展和国际竞争力的提高与知识产权密切相关(见
表1)。企业作为我国社会主义市场经济的主体,也是自主创新和知识产“中国保护知识产权高层论坛”权创造的重要主体。在2007年4月25日
上国务院国资委副主任表示,2006年申请发明专利的前50名企业中,只有华为等4家国内企业,其余绝大部分是外资在中国建立的独资或合资企业。因此加快知识产权战略的制定与实施,是目前我国企业一项重要而艰巨的任务。
表1
2
2.1
日本企业的知识产权信息工作
强烈的知识产权信息意识
,日本民族被称为“信息民族”。刘江永日本社会被称为“情报社会”
教授说,日本是一个四面临海的岛国,自然灾害频繁,因此日本人对各种灾害的预报、预警信息极其渴求和敏感;这种由防灾避灾意识养成的信息敏感和依赖,又随着岛国经济和安全的外向特点扩展到了方方面面。在知识经济时代,知识产权成为企业竞争的焦点,日本企业自然相应地形成了强烈的知识产权信息意识。
日本企业界,特别是大企业已经普遍出现了一种以知识产权活动为核心的战略发展模式,都建立了专门的知识产权部,其组织机构与其他职能部门平行。知识产权信息贯穿知识产权创造全过程,信息战略成为日本企业知识产权战略管理体系的重要组成部分。因此日本企业特别注重培养与知识产权有关的价值观念、行为规范、习惯和理念,这样可以使企业员工不断认识到并习惯通过知识产权创造来提高企业的核心竞争力。
经济全球化和电子网络社会化时代的到来,面对21世纪知识创造、
“科技立国”进一步发展到“知识产权立国”,并成立2002年日本提出了从
了由小泉首相亲自担任部长的知识产权战略本部,提出了创造、保护、应用、人才的知识产权战略四大支柱,旨在通过实施知识产权战略提高国家的综合实力。“知识产权立国”的提出对于企业的意义在于,强化企业知识产权意识,引导企业利用知识产权信息进行知识产权创造。
2006年全球GDP排名与PCT国际专利申请量排名对照
PCT国际专利申请量/件
GDP排名美国日本德国中国英国法国
PCT国际专利申请量占总量的百分比/%
495552690616929391050455902
34.118.511.72.73.54.1
知识产权信息贯穿知识产权创造的全过程,其工作是知识产权战略的重要内容。科技部在2006年12月31日发表的《关于提高知识产权信息利用和服务能力,推进知识产权信息服务平台建设的若干意见》中指运用能出:当今世界,国家核心竞争力越来越表现为对知识产权的创造、力;有效利用知识产权信息,可以掌握科技发展的进展、动向和趋势,促进和完善创新构思,科学地制定科技创新战略,缩短研究开发进程,避免重复劳动,提高科技创新起点和层次;加强知识产权信息的利用、传播和服务,是更好地发挥知识产权制度的作用,提高全社会自主创新能力的基础性、关键性环节,对于建设创新型国家具有十分重要的战略意义。知识产权信息是企业开展经营活动和参与市场竞争的重要资源之一,大力开展企业知识产权信息工作,将会有利于企业创新,从而提高企业核心竞争力。
目前,我国处于经济发展的上升时期,在企业产品研发和技术创新方面处于劣势,主要通过利用国外的先进经验来发展自身。日本国土狭小、资源贫乏、市场有限;特别是二战后,在经济、科技实力上都很孱弱。在这样的背景下,日本企业致力于开拓国际市场。它们长期借助技术引
2.2完备的知识产权信息工作体系
二战后日本经济的复兴和繁荣,在很大程度上确实依赖于其庞大的
企业情报队伍,并建立了世界上最有效率的经济情报体系。
日本的综合商社、企业情报部门和政府机构构成了日本经济竞争情金融、信息功能为一体,各报网络的三大支柱。第一,综合商社,集贸易、
国各地分支机构的工作人员将搜集的信息汇集到总部,再进行选择、加工、组织、分析和综合,向需要的用户传播扩散。第二,20世纪60年代日本的大公司就纷纷开始建立自己的竞争情报部门来弥补综合商社提供
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
TheQuantitativeAnalysisontheLiteraturesaboutDataWarehouse
YANMiao-miao,HUANWei-na
ABSTRACT:ThispaperanalyzestheliteraturesaboutdatawarehouseinSCI/SSCI/A&HCIduring1985-2006fromfive
aspects,andprobesintothedevelopmentofdatawarehouse.
KEYWORDS:datawarehouseliterature;quantitativeanalysis;coreauthor;coreperiodical
83