网络信息资源组织方式
《现代图书情报技术》 2003年 年刊
网络资源与建设
总第101期
网络信息资源组织方式
郭学娟
(华中科技大学图书馆 武汉430074)
【摘要】 从网络环境下信息资源的特点入手,提出了从网上一次信息、二次信息、三次信息的角度探讨网络信息组织方
式的特点:一次信息组织方式有自由文本方式、数据库方式、超文本方式、主页方式;二次信息组织方式有搜索引擎方式、指示数据库方式、菜单方式、主题树方式;三次信息组织方式有元搜索引擎等方式。
【关键词】 网络信息资源 组织方式 一次信息 二次信息 三次信息 【分类号】 G250.73
TheModesofInternetIGuo(TheLibraryofCentralChinan430074,China)
【Abstractwrkinformationresourcesunderthenetwork
environmwintofthemodesofnetworkinformationorganizationfromthreeanglesofprirmon,secondaryinformationandtertiaryinformation.Themodeofprimaryinformationorganizationincludesfree-text,database,hypertextandhomepage.Themodeofsecondaryinformationorganizationincludessearchengine,referraldatabase,menu,etc.Themodeoftertiaryinformationorganizationincludesmetasearchengine,etc.
【Keywords】 Networkinformationresources Modesoforganization Primaryinformation Secondary
information Tertiaryinformation
现代计算机技术、通讯技术和网络技术的飞速发展,使我们进入到一个全新的网络信息时代。网络信息资源是指通过计算机网络可以利用的各种信息的总和。网络环境下的信息资源和以往的信息资源相比,具有很大的差异。
一体的包罗万象的综合性信息系统。其存储形式为文本??超文本??多媒体??超媒体,使信息组织方式也发生了巨大的变化,不仅以知识和信息为存贮单元,而且同时展示这些单元之间的逻辑关系,为网络环境下不同形式的信息资源的管理和开发提供技术支持;由传统的顺序、线性排列,通过利用数字化存储技术,发展到超文本、超媒体技术,促使信息资源按照自身的逻辑关系组成相互联系的、非线性的网状结构。
1.3 信息传播速度快,变化频繁
1 网络环境下信息资源的特点
自90年代以来,伴随着信息资源的网络化、数字化发展,网络信息资源变的十分丰富。其特点有:
1.1 信息量大,来源广
在非网络信息中,信息传播速度快且变化最大的莫过与报纸,但是报纸一经出版,其信息便无法更改。而在Internet上,信息的更新非常及时,不少新闻站点、商业站点的信息每日更新;信息传播速度非常快,信息交流能瞬间完成。并且在因特网上,信息地址、信息链接、信息内容经常处于变动之中,信息资源的更换、消亡更是无法预测。为用户选择、利用网络信息资源带来了不便,同时也为信息的组织带来不便。
1.4 信息层次多,品种多样
广播和报纸之外的第四媒体,Internet已经成为继电视、
是信息资源存储和传播的主要媒介之一,是集各个部门、各个领域的各种信息资源为一体的供网上用户共享的信息资源网。任何人都可以十分容易地在网上发布信息、传播观点。因此信息资源数量十分巨大,有“海量”信息之称。并且信息来源十分广泛,信息发布者既有政府部门、大学院校、研究机构、学术团体、行业协会,更有大量的公司企业和个人。
1.2 信息内容丰富,结构复杂
一次信息、二Internet上的信息资源层次多,有零次信息、
次信息、三次信息;有文本信息、图像信息、图形信息、表格信息、超文本信息等。同时还包括各种电子书刊、树目数据库、联机数据库、软件资源等,是多媒体、多语种、多类型信息的混合体。
1.5 信息分布缺乏组织,分散无序
因特网已成为全球最大的信息资源基地,在因特网上几乎可以获得任何领域的信息。它的信息资源主要以数据库为主体,还包括采用多媒体技术形成的集声音、图像、文字等为
收稿日期:2002-07-29
・165・
《现代图书情报技术》 2003年 年刊
网络资源与建设
总第101期
Internet信息资源的分散表现在没有一个中心点,也没有
的经验和模式,数据库技术与网络技术的融合极大地方便了用户利用和开发信息资源,提高了效率。尤其是对象数据库(ObjectDatabase)方式,它在通常情况下是用户在指引库中检索,再将检索结果对应到对象数据库中索取原始信息。这样不仅可以提高用户的查询效率,而且可以减少网上数据流量,提高网络服务能力。
(3)超文本(Hypertext)方式 超文本方式打破了顺序线性存取
全面性的权限,甚至连本身的意义也显得模糊和多样。通过一种文献可以连接到更多相关或相类似的文献;同样,这份文献也可能从另一份文献链接而来,这种前所未有的自由度使
Internet信息资源的共建和共享变的潜力无穷,然而也使
“海量”的信息和快捷的Internet信息资源处于无序状态,而且
传播加剧了网络信息的无序状态。许多信息资源缺乏加工和组织,其往往只是时间序列的信息堆积,缺乏系统性和组织性,而且其更新和消失往往无法预测,这无疑增大了对搜集、管理和维护的难度。Internet信息资源的选择、
可见,随着数字化、网络化技术的飞速发展,网络信息资源呈现出动态性、分布性、多元性和无序性等特点,使信息的查找和检索变的越来越困难。对于21世纪的信息用户和信息管理者来说,困扰他们的不是信息太少,而是信息过多。因此,如何对网络信息资源进行合理的描述、组织、序化和提高信息的利用率是当前研究的重要课题。
的局限,采用非线性组织方式,能提供非顺序性浏览功能,比传统的组织方式更符合人们思维联想和跳跃性的习惯。这种信息组织方式将网络上相关文本的信息有机地编织在一起,以节点为基本单位,节点间以超链接(Hyper-link)方式相连,将文本信息组织成立体网状结构,使用户可以从任一结点开始,根据网络中信息间的联系,从不同角度,灵活、方便地浏览和查询信息。目前,因特网上绝大部分一次信息均采用这种组织方式。
(4)主页(HomePage)方式 这种组织方式类似于档案全宗的组
织方式,,是对某2.2到了21,,出现了大量的网络信息,它们多以数据库、超文本、多媒体的形式存在,电子型、数字型信息资源逐步占据网络时代的主导地位。随着网络信息数量的不断扩充,对网络信息进行有效的组织与控制的要求日益迫切,人们普遍感受到由于网络信息杂乱无序而带来的检索困难。在这种情况下,许多学者开始着眼于网络信息的组织,并且产生了大量有见地的文章。而笔者将从一次信息、二次信息、三次信息的角度探讨网络信息的组织方式。
2.1 一次网络信息的组织
二次网络信息,其范围包括搜索引擎、虚拟图书馆等。二次网络信息的生成原理是对一次网络信息的搜集和对已搜集一次网络信息的组织。具体有以下几种组织方式:
(1)搜索引擎(SearchEngine)方式 这是目前因特网上对网上
二次信息进行组织的主要形式,如Hotbot,Yahoo,Altavista,Archie等。它一般采用网络自动索引软件(如Robot,Spiders,或Worm)自动跟踪、浏览网页、搜集网络信息,并对搜集来的信息进行自动标引,形成一份摘要,按一定格式创建一个详尽的、可供用户进一步按关键词查询的索引数据库方式。其实质是一种报道、存储网上信息的检索工具,起到网络导航的作用。
(2)指示数据库(ReferralDatabase)方式 作为网上二次信息形
式之一的指示数据库,其存储的是有关网上一次信息的名称、地址及相关信息的描述信息,即对网上的信息资源进行分类编目,并存储其
URL或IP地址,这类似于图书馆中的书目信息数据库。具体而言,它
一次网络信息,指在网络环境下,没有经过加工、处理的原始信息。其范围包括网络电子书刊、网络学术期刊、网络会议论坛、网络新闻组等。任何一次网络信息,都有其独立存在的标志,即唯一的URL(UniformResourceLocator,统一资源地址,是Internet上WWW服务程序上用于指定信息位置的表示方法)。其具体的组织方式有:
(1)自由文本方式(Free-text) 这种信息资源组织方式主要用
把因特网上与某一或某些主题相关的结点进行集中,按照用户方便的原则,以用户熟悉的语言组织起来,向用户提供这些资源的分布情况,指引用户查找。指示数据库在网络中处于核心地位,它一方面补充了因特网检索工具的不足,另一方面充实我国的信息资源,探索出了一条建设具有专业或学科特色信息资源的新途径。形象地说,因特网是信息的海洋,指示数据库是航海图。利用指示数据库技术,我们可以将因特网上的信息资源进行集中、分类、整理,然后再以主题树的形式指引用户查找。这种方式最大的优点是入库记录都经严格选择,具有较强的针对性和较高的可靠性,检索结果适应性强。因此,指示数据库方式常用来组织专题性的或专用网上二次信息。
(3)菜单(Menu)方式 这种方式主要组织用于浏览的网上二次
于全文数据库的建造,是对非结构化的文本信息进行组织和处理的一种方式。所谓全文数据库,是将一部分图书、一篇文章或一种杂志、一份报纸的全部文本都输入计算机,使之成为计算机可以阅读和处理的文本。它不是对文献特征的格式化描述,而是用自然语言深入揭示文献中的知识单元,按文献全文的自然状况直接设置检索点。它所组织的是人们创造或采集到的网外全文信息,是输入网络的新资源。
(2)数据库方式(Database) 数据库是对大量的规范化数据进行
信息。以菜单方式组织的网上二次信息本来是一个超文本文件,一般是围绕某一专题,采用分类法、地序法、时序法、主题法等方式,将与该专题有关的网上一次信息的线索(一般是其地址)和有关描述信息依次罗列,供用户浏览选择,用户若对其中一项感兴趣,直接用鼠标在其上click即可。这种方式类似于手工检索在某一专题下对款目的浏览。由于菜单方式组织的网上二次信息专题性较强,且能较好的满足族性检索要求,因而受到用户的欢迎。如目前因特网上的Jobhunter,
resourcesforLibrarianontheInternet,resourcesforsmallbusiness
管理的技术。利用数据库技术对网络信息资源进行管理可极大地提高信息的有序性、完整性、可理解性和安全性,可以有效地处理大量结构化的数据。数据的最小存储单位是信息项(字段)。可以根据用户的需求灵活地改变查询结果集的大小,从而大大降低了网络数据传输的负载。目前以数据库技术为基础建立了大量的信息系统,形成了一整套系统分析、设计与实施的方法,为人们建立网络信息系统提供了现成
・166・
《现代图书情报技术》 2003年 年刊
网络资源与建设
总第101期
等,均是以菜单方式组织网络二次信息的范例。目前这种以菜单方式组织的网上二次信息大多出自因特网爱好者或自源者之手,也有部分由机构或政府部门制作提供。
(4)主题树(Themetree)方式 所谓主题树组织方式,就是将所
据库和菜单方式组织成网上二次信息,从而使网上一次信息进入二次信息领域,实现了对网上一次信息的控制,在逻辑上序化和优化了网络信息资源,为充分开发利用这种信息资源提供了前提条件和可能。同样,对网上二次信息进行加工后所形成的网上三次信息,可帮助用户快捷、高效地找到合适的搜索引擎、指示数据库和专题菜单,以进一步提高检索效率和网络信息资源开发利用水平。由此可见,从“网上一次信息”到“网上二次信息”,再到“网上三次信息”,进入网络信息资源的可控性、有序性、易用性一步步增强,人们对高速信息网上信息资源的技术管理能力也一步步提高。三个不同层次的信息分别代表着对信息的不同加工程度,构成了一个类似于文献链的“网络信息链”,它有助于人们高效、充分地利用网络信息资源。:
1]..,2001,(2)
[].,2002,(1)[3..情报理论与实践,
2001,(4)
[4]忘慕东.搜索引擎的发展状况及使用技巧.情报理论与实践,
2001,(4)
[5]黄 郴.网络二次文献——搜索引擎.上海高校图书情报学刊,
2001,(1)
[6]司 莉,彭斐章.网络信息资源组织与目录学的创新和发展.图书
含某一学科的所有已获得的信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,建立主题目录和子类目。子类目下可以进一步细分,最底层类目内按字顺或其它标识进行排序。用户通过浏览方式对这个等级分类目录体系逐层加以选择,层层遍历,对特定主题信息进行查询,直到找到所需的信息线索(即相关站点链接),并通过信息线索直接找到相应的网络信息资源。这种组织方式简单易用,屏蔽了网络信息资源系统对于用户的复杂性,提供了一种基于树型浏览方式网络信息的浏览界面:信息检索时可按照一定的体系结构,逐次查看,因而对于用户而言,目的性强,查准率高。
2.3 三次网络信息的组织
三次网络信息,则以元搜索引擎最为典型。三次网络信息的生成原理与二次网络信息的生成原理相同,即:对二次网络信息的搜集和对已搜集二次网络信息的组织元搜索引擎(M)搜索引擎,,接收并处理用户的查询提问,在进行实际的查询时调用一个或者多个独立搜索引擎的数据库,搜索结果是来自独立搜索引擎的检索结果或者是这些结果集合的综合,结果呈现既可以是引用原始的独立搜索引擎的页面,也可以是由元搜索引擎重新定制后的形式。
元搜索引擎一般是采用品牌知名、检索效果较好的主流搜索引擎数据库,一次提问同时检索多个数据库,提高了检索的效率,同时也起到了对检索工具的推荐和指南的作用。另一方面,元搜索引擎的检索模式还为各个搜索引擎的集成检索提供了可能,具有一定的先进性和实用价值。如Meta
Crawler,SavvySearch,ProFusion等,都是常用的元搜索引
通报工作,2001,(9)
[7]马费成,陈 锐.面向高速信息网络的信息资源管理(一)——从
技术角度的分析.中国图书馆学报,1998,(1)
[8]张 俊.略论网络信息资源的组织.图书情报知识,1998,(2)[9]李广建.元搜索引擎及其主要技术.情报科学,2002,(2)
[10]燕惠兰.网络环境下信息资源的组织与检索.情报科学,2001,
(9)
[11]尚可聪.信息组织论要.图书情报工作,1998,(11)
[12]董 慧.基于Internet的信息组织研究.情报学报,2001,(2)
擎。
3 小 结
总之,对网上一次信息进行加工,运用搜索引擎、指示数
(1980—2000)光盘珍藏版征订通知《现代图书情报技术》
(原名 由中国科学院主管、中国科学院文献情报中心主办的信息管理专业技术刊物《现代图书情报技术》《计算机与图书馆》
)1980年创刊杂志。“全文检索数据系统”光盘版已由中国新闻出版署批准出版。该光盘汇集了《现代图书情报技术》创刊20年来
(1980—2000)编辑出版的全部内容,集中展现和凝结了我国图书情报领域学习采用现代技术的启蒙→学习→试验→起步→普及→发展→应用→提高→进步的各个历史发展阶段的进程概况。《现代图书情报技术》光盘版集创刊号至今,共出版102期。数据盘以全文字录入方式压缩制作,真实记载了期刊原貌,并可任意查找、检索、浏览。《现代图书情报技术》光盘版是跨世纪的数字化进程中具有独特历史意义的电子出版物,无论是实用性还是珍藏性,《现代图书情报技术》光盘版都是不可多得的收藏珍品。
目前,《现代图书情报技术》光盘版,由《现代图书情报技术》编辑部独家销售,(每盘售价:人民币180元)凡是本刊论文作者编辑部按成本价赠购1盘,每盘收成本费50元(邮费另加15元),数量有限,欲购从速。欲购者可通过邮局或银行汇款至北京中关村北四环西路33号《现代图书情报技术》编辑部,款到发货。
联系人:李春源 联系电话