4.信息获取
第四章 信息获取
了解各种信息源及其特点,掌握信息评价的一般指标,能有效进行信息评价及其选择,掌握信息获取效率的一般指标,熟悉信息获取的途径和方法。
1. 信息的获取和搜集是信息管理的首要环节,施展开信息服务的物质基础。
信息管理学将信息源和信息的获取作为主要的研究对象之一。 2.信息源:人们在科研活动、生产经营活动、文化活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果的原始记录加工整理所得的成品(如数据库、文摘索引杂志等等)都是借以获得信息的源泉。
3.信息源的划分:传播方式→⑴按性质—口传信息源(智力信息)、文献信息源(记录型信息)、实物信息源
⑵按时间—先导信息源、即时信息源、滞后信息源 ⑶ 按加工—零次信息、一次信息、二次信息、三次信
息
4.信息划分(便于对信息进行管理):
a.记录型信息:按物质载体:印刷型、微缩型、计算机阅读型、网络型、视听资料 按内容、性质和加工:一次信息(凡是在科研、生产、经营、文化及其他
各类活动中产生的原始信息,称为一次信息。如期刊论文、研究报告、市场调查报告、专利说明书及各种网络信息)
二次信息(对一次信息进行加工整理后产生的一类信息,如书目、题录、简介、文摘等形式的检索工具。二次信息的重要作用,不仅在于报道,更重要的是为查找一次信息提供线索) 三次信息(在一、二次信息的基础上,经过分析、
综合而产生的信息。人们常把这类信息称为信
息分析研究的成果,如综述、述评、学科年度总结、文献指南、书目等)
b.实物信息源
c.智力型信息源:由人脑存储 d.零次信息源:是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉(包括听、视、嗅、味、触觉)的结果。零次信息具有直接性、及时性、新颖性、随机性、非存储性等典型特征。
5.信息的评价与选择
(1)信息评价的一般指标:有价值的信息是在特定的问题和状态中被利用并有效发挥其功能的信息,是实现某种目标所需要的知识,是进行决策和选择所必需的资料。必须具备及时性、准确性、综合性、获取简易性、经济性等特性。具体地说应满足以下6个条件: a.能及时地以适当的方式提供解决问题所需要的依据; b.信息符合用户需求的内容; c.信息的可信赖程度高;
d.信息具有综合性;
e.信息容易获取(既不是用特殊手段或极少数人才能获取); f.信息的费用与目标吻合。 (2)信息的具体指标: ①信息源的评价与选择
a.直接评价法:局限性—第一、对各指标的评分带有极大的主观性,完全取决于信息工作者个人对信息源的认识和了解。
第二、信息源的价值只有在实际利用中的真正
动态,因而不能正确反映信息源的价值。
第三、上述五项指标也还是不能够完备的。 b.间接评价法:间接评价法是通过信息用户来评价信息源。以调查表的方式调查用户对信息源的需求和利用情况,然后由信息工作者对调查所得到的数据进行统计分析和对比,对信息源的价值作出评定。这种方法的特点是需要信息用户密切配合,工作量较大,但评价效果较为客观。 评价指标: ⅰ.评分平均值:
m
R
j
aij
i1
[注:Rj—信息源j的平均评分
m—被调查人数
aij—被调查人i给信息源j的评分]
m
ⅱ.评分比重:
pi
n
m
i1
aij
m
[注:pj—信息源j的评分比重
aij
j1
i1
n——信息源数 aij—被调查人i给信
息源j的评分
m——被调查人数]
ⅲ.最高评分频度:
pmax
mm
'
[注:pmax—最高评分频度
m´——给最高评分的被
调查者数
m——被调查人数]
m
ⅳ.平均名次指数:M
j
C
ij
i1
m
[注:Mj—信息源j的平均名次
Cij—被调查i给信
息源j的评分排队名次
m——被调查人数]
7.信息准确度的比较评价 (1)第一种角度
a.从不同的信息源获得同一性质的信息,对这些信息进行比较
b.定期地、系统地搜集信息,调查过去同种信息是否出现并和新获取的信息进行比较评价 c.从多种信息源搜集、分析同种信息和相关信息,与切题的信息进行比较评价
交叉检验—一般把从各个方面获得同一信息,并进行比较评价的方法叫做“交叉检验”。由于信息的比较也是相应的信息源的比较,所以经常注意各种信息源的特点及各自携带的信息、可靠性水平等方面的评价数据,是非常有益的。
(2)第二种角度:从信息所含的六个要素出发评价信息的准确度
对信息进行比较评价时,要把信息分解成以下六个方面: 内容(What) 原因 (Why) 时间(When) 地点(Where)
人(Who)
方法、途径、状况(How) 步骤:
7.信息获取的效率指标:
⑴采全率(Recall)—用来衡量切题信息搜集的完整程度,指某一信息系统(信息库)所含的全部切题性信息(对该系统全体用户而言)在当时系统内外所有切题信息中所占的比例:
P
rR
[注:P—采全率
r—该信息系统中切
题的信息
R—当时系统内外全
部切题的信息]
⑵采准率(Precision)—用来衡量信息搜集的针对性,指某一信息系统(信息库)所含的全部切题信息(对该系统全体用户而言)在当时该系统所有信息中所占的比例:
E
rQ
[注:E—采准率
r—该系统中切题的信息
Q—系统内所有的信息]
⑶及时率——用来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。它由搜集过程的每一环节(从信息的产生到其被输入到信息库)所花费的总时间来计算:
n
T
i1
ti
⑷费用率(Cost)—用来衡量信息搜集的资金效率,指用于信息库中单位信息的费用的最低能力。它取决于搜集过程的组织、各环节的技术装备及其他因素:
C
FG
[注:C—单位信息的费用率
F—年度搜集信息的总花
费
G—年搜集到的信息量]
⑸劳动耗费率—指信息系统搜集到的单位信息所消耗的最低劳动量,可用搜集过程所有环节的劳动消耗总数来计算:
n
L
i1
li
[注:L—搜集信息的工作量
li—单位信息在每一环
节中的劳动消耗率]
该指标取决于信息搜集过程的难度、条件、效率等方面的因素。 8.信息搜集的原则:⑴针对性
⑵系统性
⑶预见性—在信息搜集中不仅要充分注意现存的信息源和信息渠道,还
要着眼未来,预见可能产生的新的信息源和信息渠道
⑷科学性—需要经常采用科学方法研究信息源的分布规律,选择和确
定信息密度大,信息含量多的信息源 ⑸计划性 9.信息搜集的方法与途径:
⑴采购—包括订购、现购、邮购、委托代购等具体方式
⑵调查—包括访谈,对实物、现场的实地考察搜集(如现场调查、访问、发放问卷、
样品搜集等等)
⑶交换—利用本系统所拥有的信息源(如出版物等)与其他单位进行交换、互相调剂、
互相补充、扩大信息来源。交换的信息源多属于内部资料、非卖品,不能通
过采购或其他方式获得,只有通过交换取得。
⑷索取—可以通过通讯联系或直接派人联系取得
⑸检索—即以手工方式或计算机方式从各种不同的数据库和信息系统中查寻所需要
的信息