浅谈网络信息检索的发展趋势
科 学理 论
谈浅 网信息络索检的展发趋势 姜
丽
摘( 滨 医州学 图书馆院 25 6 603 ) : 本文要对网 络息信检 索的特征、方式 以未来及的展趋 发势行了进步的初探讨 。’ 关 词键 网络 信:息索检 趋势
I n e rt ent 在球范 全围的迅内速发展 与熟成,促成 社会各 域信领 息飞速 膨胀, 为 们人查找 、获取息提供信 丰富的了信源, 息越来越多 的 人开始用利 网络查询来息信 网络。息信检 索是 就据用根 的需户 , 要 从大量 的 络网信集息 中合查询 出特定 即相() 关一小的部信息的分过程 那。 ,么面 对网大上量繁 复杂的信纷息资源 , 今后 络网信 息检 索的展会是发怎 样 ?笔呢 就者 这 一 题 问 行 了探 讨 。进 1. 网 络信检息的索源 信息起检始 索于世 上纪5 O年代 , 0年代6 经实用 化, 已7 O代联机年检索服 形务市场成 8 ,年代O现多元实、化智能化, 9 O年 代息信检索 统与因系特 网结 合 , 才现 了早出简期单 的网检索络 。 但 于 由 nIt e r ne t 迅的发猛展其所使 的含 信息 数激量增, 在这样一个 无限 、无序 、 浩瀚 无边 的 信空间里息 快速,找 并查获取所 需的信 已息为人成最们切 的需迫要。 2 .网络信息检索的特 征 2 .1息信检索 空间拓的 宽 网信络检息 的索间比空之传的情报检统索 是大地 拓大宽了, 它 可以检 索因 网上特的类各资 源, 而检索 不者预先必知 道种某资源的 体具址地。 其检 范索覆盖了整个 围特因 网这全一球性的 络网 之络网 ,访为问获取和广泛分别在世 各界地、成 上万 台服务器和 千主上 机的量信息大供 提可能了。这 优一势任何其是信息它检索方 所式 具不备的 , 如: 际国用商联机检索 只也是能检索 一台、 某 某几台 主 机 或 某一 ‘ 局部网 络
的内 若数 干 据库。
用户搜索
、 浏 览时给 予直接 的持支,而且 够能提供具有 独搜 立索能功 智 的 能的体幕后支持 。 着随 网用络户检 对索的精度、检索 率效要求 的 不断高提,网络 索软 检 开发更重视开件发检索具工在索检功及检 索能服上 的智能化程务度 4 .可视化检2索网络 检的索可视 化是将数指库 中的不据可见 的语义 关 用 系图 形式 像可化视显示 表达用并户 索检过 程。视可化 检有许 多索优 点 ,主 要表 在现: 文对献 检或式 内部索 语义关 的系理解有助 于用户判断 一 检个 中的索相关献 文;可 视化环的 境可为用以户提供更丰富和更直 观的 信 息;相关性在 传统的息信检
索中只指检索果结 检索式、相关, 而 在 可视化 检索 中则指 检 结 果 之 索间的相 关度 ; 使 得 用 可 以进 户 交行互 输 入 ,式允 许 在 息信空间进行 动态移动 ,允 许户用修改数 据的 示显式方 , 他使们理 解数据 的 人个 偏好 可 视 化 ;减 少 了解理检结果索的时 ,间 可以对 相关 息信进 行聚 类分析 ,聚而类析分可帮人助们现新发的科点, 学可作也为反馈工具 的 操; 纵检索 内的 过部程;提高 检系索统与人 之间的交性互 ;检 结果索可以 模 仿络环境形成拓网结扑 构图 ,在扑结拓构图 所有相关文中献其他或类型资源 被归为 将同类 ; 一个透的明检索程使检索过更容更有效易。 4. 3媒多体 息信检 索前,目于基 内 的多媒容信体息检索 研是 的热 点。究基 内容于 的媒 多体 信息 检 索 是根 据媒 体 媒 和对 体象的 内容 及 下 上 文 联系在大规模多媒体 数库据中 进检索 。行多 体媒息信检索 一项涉及多是个学 科 的课题 , 因 它 需为要利用图 处 像、 理模式识 、 计别算机觉视、 图 像 解等 领域 的理知识为作础基, 还需认从科 知学、 工 人智能 、数据库管理 系统、 人机 交 、 互信 息检等索领 引域新 的媒体入 数表示据 数和模 据型,从 而 计 出设可 靠 的 有、效检的算法索、 系统 结 构 以 及 好友的人 机 界面。 .4 4 于基网 格信息的 检 索网格概最念早于 2O 世 纪9 0 年 代中期提出, 是从 电力 网念借鉴概来的。过其 要特点主是把整个特 因集网成为一 台 大 的超级巨 计机算, 以 现 实球全范围 的算 资计源、 储存资源、 数据资 源、 信息 资源 知识、资源、 专家资源 、 设备资 的源全 面享共互。联 实网了现算机计硬件 的 通,连we 实现 了网页 的连d, 而 网通试 格实现图 联网互上有资所源全面 的通连,在 动 态的、 异 构的 拟组虚 间织实协 同的现源资共享以及 协 同 解问决 题。共 享是格强调的网重,点但 这是 种共享又必须 是 高 度可的, 需要控在 资 提源者和供消 者之 费详间定义细些哪部是可 以分被享 的共, 在什么条 件下 可 共享 以以及应相的理机制 管、 付费机 。 制 前当, 着随计 机高算 技的不断发科展 ,网络 检索像就 当 年照相机一的 , 样步超着简逐化 单 、性人化方 发 向展,检索 面越界越来简 单友 , 越好来越 适用 普通与用。 用 户 户可以 容很 地 进 易行 上网自动 标 引 、 动自文 摘 、 自动 跟 、踪自动漫 、游 器机译翻、 多媒 检索欣 赏、 动体态接 、 数据 连掘挖等操
作 , 方 、及便 、 时准确获得地需信所。 息网络信息索的发展检远滞永 于后用户 需的求,这 个是争不的事, 但 实也正用户是需的求动推 着络网信 息索检术 技的不完善。 在 断网信络检索 息 断不发壮展大的天来展望未来今 ,人信类息 需求 究竟够能被满足到何种程 ,度 我拭 目以们。■待 参 文献 …柳群考 . 英网 络 信息 检索 技 术现 状 及 发 趋展势 . Ⅱ 】情 报探 索 2 0 0 5 (5 )
6: 6-6
8
2 2.互交式作业式 所有的方网络 息检索工具信 具交有式作互业的 特 点, 够能从 用户令 命获中取 指令, 时响即应户 用的要求 , 行执相 操作,应并 有具良好 的 信反馈息 能功,用户 可 在以索检程 中及过时地调整检 策索 略以 取获良好 检索的 结果, 并能就遇所 到问的获题得联机帮助指和导 。 2 .3用户面界好且友操方作 便 络网息信检对 用索户蔽了各屏局部网 络 物理差异 ,间 用户使使在用这些服时感到 务明 显系统透 的明。检度者 使用 自索己 熟所 的悉检索界面和命 令 方式入输询提 查问就可 实现以 各对 种 构系异统据数库 的访 问 检、 索 。 . 3络网 信常用息检的方索式 3 . 1链 接法是 指用户 在阅读超文文本档时, 利 用档 文中链的接从一 网转页向另 一一 相 关页网 。有类些于似传统文献索检中的 追“检 索溯 ,” 即据根 文献 后 所 的参附 考 文 追 献溯 关 相 献 ,文一 轮一 轮地 不断 扩大 检 索范 围。个 人用户 在网 络览浏的 过程 常常中通过建创签书或链表热将 一些常用来的 、 优 秀 的 站点 地址 记录 F , 来 组织成 目 录以备 今后 之 。但 需 种这做 只 能 满 法 足个别、… 一时之 需, 相对于这 网络信个的发息展, 检其功能似索 乎是不微 道足 谈,不真正上意义的 上络网信息检。 索 3. 2通 网络过 源指资 南查找信息 为来了对 特 因网这无个 序的信世 息界加 以织组、管 理, 大使有价量的值信息入一个有序 纳组的织 体,系专 业 人员 了许做多努和力发 。开就也基于是专业员对人网 络息 资源 信产的、生传 递与 利机用 的广制 泛解了 ,和对 网信络 息源资分布状况的熟 悉, 以及 对各 种 络网信资息 源采的 、集 组织 、评价 过滤、 、制、 检控等索段手 全的 把面握 而 发开的可供出览浏检和的索 络资源网题主南。指 3. 3用利索引搜擎行进 息检信索 这种方 法较 是为普遍、 常 规 的网信 络 检息索方。搜法引擎是提供索用给户行关进词、键词 组或自然 语言 检
索的 具。工种方式这 用户可 以用辑组合逻方式输入 种 各关键词 ,搜索 引擎 根据 这关些词寻 键用户 找所需源资地的,址然后 据根一 的定序顺馈给反用 户包 含 这 些关 键 词信 息 的 所 有网址 指 向 和 些 网 址这的链 接 。 用利搜 索 引 擎进 行 信 息检 具索有:省时 力省 ,单简方便 ,索检 度速、 范快围广, 能 及时获取 新 信 增,息 这是才正意真上义网络信的检索。息 4 . 络网信检息的索发展趋势 4 , 1智能索检 年近被称来智能搜索引擎的为络检网工索 已具 经出现, 智 能搜索擎有引 个 主3要的特征: 网络 蛛 的蜘能智、化 为 定特户用提相供 关信 息、 索搜 引擎人机 接的智能口 。 化可以在它特 网因导引中用 户, 不在 仅
[
2 】 徐. 网谦信络 检索息智的化能趋 . 势图书馆 论 理实与践2 0 0 6(2 ):
6 3 - 6 5
【
3] 黄如 ,花 春 张蕾.网 信 络检息 的索发展势.趋[ ¨ 书情报知识图, 20 0 2,
( 4 ): 48 5-0, 6 6
[ 4 ]周.宁 21 纪世信息组织检与 索可视化 、的智能 化发展方向 现 图 代 书报情技 , 2 0 术02 4( ): 4,6 1
8
5 【] 秦雪 ,梅高凡 .等 视化情报检可.索【 I 图】书报工作情 ,20 0 2 (4 ) : 8 9  ̄ 92 1 9 [6 】史 田华. 网 络息 的智信能搜索化 图书.杂志, 馆 02 02 ,2 1 ( )3 1: 5 -1 8 2 3 [7 】焦玉英 , 绍宏等符 .信息检【 索M . 武]: 汉汉武大 出版学社 , 200 2
3 3