计算机情报检索试卷B答案
计算机情报检索答案——B 卷
1 研究的对象和内容:情报检索的研究内容包括一切与情报检索有关
的系统、过程、理论和方法。一切可以存储和检索利用的信息类型;
各种情报检索系统以及运行过程;各种过程中使用的方法,以及在
情报检索实践和研究基础上形成的各种理论和假设,均包括在这个
范围之内。
情报检索的研究对象通常可以展开为以下几个方面:
1)情报检索理论;
2)情报检索系统;
3)数据库和数据仓库;
4)联机情报检索和网络搜索引擎;
5)检索策略与方法;
6)用户研究与培训;
7)自动标引、自动分类、信息过滤和信息提取技术;
8)数字图书馆。
相关的科学领域:
1)计算机科学;
2)数学;
3)语言学;
4)人工智能;
5)认知科学。
2 按设备划分:
1)传统的书本式和卡片式检索系统;
2)穿孔卡片检索系统;
3)缩微式检索系统;
4)计算机情报检索技术;
5)视频信息查询系统;
按功能划分:
1)文献检索系统;
2)数据库管理系统;
3)自动问答系统;
4)管理信息系统;
5)决策支持系统;
按应用领域或具有查询检索功能的信息系统几乎在各个领域都有应用,
且可能以不同的形式出现。
3 全文数据库的特点与用途:
1)直接性,能直接检出原始文献或解决问题所要求的文献资料,不必进行
二次检索;
2)详尽性,文献的正文部分或附属部分都可以检索和显示,用户可以直接
查看到文献正文中的每一段、每一句和每个词,还有可能看到某些边缘性情报;
3)快速,用户可以通过检索系统快速地浏览、检索和获得文献原文,不受
地理位置的限制;
4)标引方法简单,绝大多数全文库都利用计算机进行全文自动抽词标引,
生成倒排档;
5)用户接口多为菜单驱动型,或采用较简单的检索命令,易学易用。
6)检索语言多用自然语言,少数用受控语言。检索方法除使用布尔检索以
外,位置检索占有相当突出的地位;
4 目前图像数据库的发展状况:纯粹以图形或图像为记录和检索对象的数
据库已经问世。
图像数据库的种类:
1)计算机辅助检索的缩微图像数据库;
2)录像缩微检索系统;
3)缩微技术与光盘相结合的系统;
4)实现图文一体化存储的数据库;
5)纯图像数据库。
图像数据库的用途:
1)图像检索与提供;
2)基于图像的计算机辅助教学;
3)计算机辅助诊断或鉴别。
5 元搜索引擎的关键技术:
1)检索式转换:在接受用户的一个查询请求后,面临的一个首要问题就是
如何将此检索提问式进行转换,分发给不同的成员搜索引擎进行检索处理。
2)成员检索引擎的选择:之所以存在数据库的选择问题,是因为如果不对
成员搜索引擎数据库加以选择,直接把用户查询发送到每一个成员搜索引擎的话,就可以把查询传输到无关搜索引擎,这将导致不必要的网络通信,而对无关搜索引擎来讲也是资源浪费,另一方面,从无关搜索引擎得到的无关结果混于检索结果之中,需花费很大代价从中识别出有用信息。
6 用户信息需求一般有一下三种类型:
1)首先是对最新信息的需求,即需要能及时获取、迅速传递最新信息。这
类需求多查全率和查准率一般要求不高,但是却对信息的新颖性极其重视;
2)用户的第二类信息需求是想了解某一理论、方法、事件等片段性信息,
以解决其研究或日常工作中遇到的具体问题。这类需求对要求一个“准”字,即检测的信息应有针对性,能解决实际问题;在这里,查全率要求是次要的,而对
查准率的要求显著突出。
3)信息用户的第三类需求是研究人员想对某一课题或项目进行系统、详尽
的了解,以便掌握问题的历史、发展及现状。这类需求特点是一个“全”字,即要求检索全面、系统、彻底。即对查全率要求很高,对查准率要求次要一些。
7 聚类检索算法的基本思想:
1)建立检索系统数据库中文档的向量表示,并进行聚类处理,形成聚类文
档。
2)接受用户检索请求,并将检索请求表示或转换为提问向量;
3)确定相似度计算函数,并计算提问向量与聚类文档中各文档类向量之间
的相似度。
4)根据系统中预定义的相似度阈值,选择与提问向量相似度值大于阈值的
类向量作为下一步进行检索的文档范围;或者,只选择与提问向量最相似的类向
量中的文档作为继续检索匹配的对象。
5)在选中的类向量所包含的文档集合中,逐一计算提问向量与各文档向量
的相似度,并将相似度值大于指定阈值的文档作为命中结果排序输出。
8 光盘的技术性能:
1)存储能力;
2)数据记录能力;
3)误码率;
4)数据读取速度;
5)数据保存时间。
9 系统分析的内容:
人们常常用以下英语关系代词和副词说明系统分析阶段的主要内容:
1)Who :指通过调查研究,弄清楚提出建立系统的机构及其有关情况;
2)Where :指明确该机构和要建立的系统所处的环境、边界和外部影响等空间方面的因素;
3)When :有关系统时间方面的情况;
4)What :该机构在所处空间和时间条件下要建立的系统的目标和功能;
5)Why :为什么应该具有这样的目标和功能,这实际上是系统设计阶段的工作。参加系统分析和设计的人员应该经常用上述方式来提出问题,以保证系统分析的全面性和深度。
系统分析的方法:
1)简明扼要地说明系统分析的理由;
2)要求指出对系统的性能和情报内容的要求,指出需求情报的人员、地点、输出格式和传播方式,介绍搜集情报的方法、地点和时间等;
3)说明要搜集的事实;
4)说明某些事实的来源;
5)工作进度安排,例如系统分析阶段各项活动进度表。
10 系统评价的范围和类型:检索系统包括一切具有存储和检索功能的设施,故评价范围也应包括各种不同类型的系统及其组成要素,如手工检索、脱机检索系统、联机检索系统、标引子系统和检索语言,等等。一个系统的作用往往也表现为多个方面,如性能方面、经济方面、社会方面。评价的目的和方法也多种多样。
因此,评价可以有很多不同的类型:
1)宏观评价:只对检索系统的宏观方面,如收录范围、情报源类型、系统
结构、利用率、影响等,进行考察比较;
2)性能评价:测定检索系统的质量或服务效果,即满足用户有需要的程度。又称检索效果评价;
3)效益评价:测定系统提供的服务使用户或系统本身获得的效益。
4)费用/效果评价:考察系统达到某种性能水平与所需要费用之间的关系;
5)费用/效益评价:考察系统的服务效益与费用消耗之间的关系,了解其成本/效益比是否合理。