RSS技术与图书馆的个性化信息推送服务
156
福建电脑2008年第8期
RSS技术与图书馆的个性化信息推送服务
唐小波
(陕西理工学院数学系陕西汉中723000)
摘要】【:本文探讨了RSS技术的优点和使用,详细分析了基于RSS的图书馆个性化信息推送服务的工作原理,最后从RSS仃阅和RSS服务机制两个方面重点阐述了图书馆个性化信息推送服务的模式。
关键词】【:RSS技术;信息推送;个性化服务;
1.RSS技术
1.1RSS的概念
因其版本的不同,所以RSS分别被定义为"ReallySuppleSyndication"(真正简单的聚合)或"RichSiteSummary"(丰富站点摘要)。RSS其实就是一种XML格式,用于为内容整合客户端提供选择性的、汇总过的Web内容,更确切地说,是基于XMURDF的描述资源集合(特别是网络资源等)的轻便、可扩展的元数据集[1]。RSS可用于共享新闻标题以及其他网络内容的XML格式。RSS秉承"推"的信息服务理念,是一种可以广泛应用的"推"技术,它能够把预定的信息(包括标题、提要和内容)按照用户的要求"送"到用户的桌面,这样用户就不必频繁登陆每个网站查看自己需要的内容了。1.2RSS特点
聚合个性化1)信息来源多样、
任何内容源都可以采用RSS这种内容包装定义格式来发布信息,用户可以利用RSS客户端阅读器软件,按照自己的喜好将感兴趣的内容来源"聚合",类似阅读电子邮件一样享受多来源信息的"一站式"服务。
信息发布时效强2)技术难度低、
RSS是一种简单和成功的XML应用,实现容易。RSS技术秉承网景公司(Netscape)"推"(Push)信息的概念,当新内容在服务器数据库中出现时第一时间被"推"到用户端阅读器中,极大地提高了信息的时效性和价值。
资料可管理3)信息无干扰、
RSS客户端阅读器软件的特点是完全由用户根据自身喜好以"频道"的形式订阅值得信任的内容来源,用户具有对订阅内容的控制筛选权,没有广告或者图片来影响标题与概要的阅读,并可通过阅读器对下载内容进行离线阅读、存档保留、搜索排序、分类等操作。
4)即时信息通告
如果有了更新的信息内容,RSS便会给阅读器或者内容集结器发出提示。图书馆的工作规章、读者须知等内容经过一段时期后就可能过时,修改后的内容常常不能及时让图书馆员或者读者了解。有了RSS阅读器,他们就能及时收到最新信息,而且对图书馆工作规章、读者须知等的演变了解得一清二楚。2.使用方法和步骤
首先RSS内容提供者为要发布的信息创建一个RSS频道,在这个频道中包含其要发布的信息(标题、简介、内容等信息)的标准的XML文件,它遵循所谓的RSS技术规范定义的格式。RSS的格式是相当简单的,就是一个XML文档,该文档可以是网站服务器定时生成的XML文件,也可以是动态生成的,但都是可以通过HTTP协议获取的。XML描述了RSS的频道名称(<chanel>项定义)和一篇文章的信息(<item>项描述文章的题名、地址、作者和发布日期)。下面一段是书香门第网络图书馆RSS服务的XML文档的一部分:
<?xmlversion="1.0"encoding="gb2312"?>-<rssversion="2.0">_<channel>
<title>书香门第网络图书馆</title>
-<image>
<title>书香门第网络图书馆</title><link>http://www.bookhome.net</link>
<url>http://www/bppljp,e/met/o,ages/logo.gif<.url></image>
<description>大型网络电子书库,电子书两万余册。</description><language>zh-cn</language><docs/>
<generator>闸北区第一中心小学老蔡版权所有</generator><ttl>5</ttl>-<item>-<title>
-<![CDATA[别怕安眠药]]></title>-<link>
_<![CDATA[http://wwwbookhome.net/showbook.asp??id=19174]]><link>
<author>陈俊钦</author>
<PubDate>Wed,25May200500:00:00GMT</PubDate>-<description>
-<![CDATA[时尚健康。拒绝服用安眠药,跟完全仰赖安眠
药,都是忘掉了我们才是药物的主人的行为。作者希望通过本书能破除安眠药的神秘感,让读者知己知彼,引为己用。]]>
<description></item>
RSS频道可以被远程应用程序读取并转换成标题和链接,用户可以定制RSS信息频道,并获取相关的信息。用户使用
目前国外有很多优秀的软件,例RSS服务需要安装RSS阅读器。
如RSSReader、FreeDemon、SharpReader、iSpaceDesktop等,国内也有诸如周博通、看天下、新浪点点通等软件。为了告诉RSS阅
读器去哪里寻找新信息,用户需要在阅读器配置中输入信息源的URL。RSS阅读的优势还体现在目标信息源的地址只需在配
第一置中输入一次即可,而毋需像访问网页一样每次必须输入。
次使用,先下载RSS阅读器,安装之后,就需要在支持RSS的网站上订阅自己喜欢的内容。以天极网的RSS频道(HTTP://rss.yesky.com)为例:①在页面中找到有XNK字样图标,点击想要订阅频道的XML图标(如果已经给出了URL链接,可以复制后直接跳到第3步)。②在出现的新页面中复制IE地址栏中的URL。③添加为RSS阅读器的收藏频道。以周博通RSS阅读器为例,打开阅读器,点击工具栏中的"新增频道",在弹出的"选择你要添加的RSS频道"窗口中选择"手工输入频道地址或者OPML地址",然后点击"下一步"按钮,将刚才复制的URL地址粘贴到输入框中,点击"下一步"按钮,然后输入频道名称,选择频道位置,点击"完成"按钮,系统便会自动链接上该频道获取RSS列表。按照以上方法,用户可以完全定制自己的信息频道。定制好信息频道,就可以每天自动获取这些信息源上的更新内容了。
3.个性化信息推送服务的工作原理和流程
信息推送服务是基于推送技术发展而出现的一种新型服务,它是根据用户提出的明确要求提供信息服务,或通过对用户个性、使用习惯的分析而主动地向用户提供其可能需要的信息服务。图书馆RSS个性化信息推送服务的基本原理和过程是:读
主题聚者信息需求了解、专题信息搜索、生成RSS信息文档、
2008年第8期福建电脑
157
合、产生RSS提要库、信息内容集结、产生RSSfeed、推送到读者兴趣库等。读者首先需要登陆到图书馆网站,然后进人My
信息偏好等。下载RSS阅读library,输人一些自己的兴趣特征、
器,然后把感兴趣的RSS链接加人到自己的RSS收藏夹中,RSS就会将图书馆最新的信息网页链接按照读者指定的方式送到其电脑桌面上。读者可以挑选自己需要详细阅读的页面,打开links,阅读原文。
的个性化信息推送服务过程如图所示。
图1基于RSS的图书馆个性化信息推送服务工作流程
3.1建立读者兴趣档案
为读者提供个性化推送服务,首先必须获取读者个性化的信息需求特征,建立读者兴趣档案。读者可以在注册Mylibrary的时候将个人的喜好、知识侧重等进行手工输人。通过读者手工输人信息,图书馆RSS为其建立读者兴趣档案库。当然,对于不愿意通过此方式定制的读者,图书馆信息发布者就需要对该类读者的兴趣进行推测,例如通过跟踪读者的上网行为,分析其信息偏好,以便于为其提供有针对性的个性化推送服务。3.2对信息源的搜集与整合
图书馆RSS信息发布者首先就要确定RSS信息源,也就是需要从其中抽取内容的网站,然后要对该网站的信息源进行分类,通过对该网站的结构分析,再根据用户的兴趣需求与信息源进行匹配,由此产生相关标题的定位信息。3.3RSS文档的形成与主题聚合
经过搜集抽取出的信息源,按照RSS标准的要求,自动形成具有统一格式的RSS文档。RSS文档是一个XML文件,它包含的信息源暂时还处于离散状态,RSS文档形式是为其内容提供的一个提要。通过主题聚合,RSS分别将这些离散的文档按照主题的相同或相关性聚合在一起,而且会不停地自动更新这些主题的链接。当有新的内容发布时,RSS就会自动更新其链接,而且RSS传送的是信息源的链接以及对信息源内容的简单描述,或者是从原文中摘取的几行文字,并不是原文。3.4对信息内容的集结与RSSfeed
目前可用的内容集结器主要分为二类:一类可以通过读者端的电脑接收信息,如FeedReader,Newgator和FeedDemon;另
图书馆信息发布者在生一类则是通过网页浏览,如Bloglines等。
成RSS文档之后,对其进行主题聚合,然后加人到RSS提要库当中。内容集结器会定时到RSS提要库那里去选取并订阅RSS文档,并自动生成RSS格式的XML文档,然后通过RSSfeed将文档发送给读者。RSS将网站看作是一系列频道(channels)的组合,各个频道又包含了一系列资源(Items),因此通过对频道及所含资源的描述可以实现对作为资源集合的网站的描述。利用RSS元素描述的网站内容汇总文件我们称之为一个RSSfeed,它通常由4个主要元素,<image>,<item>,<tex-tinput>构成[3]。其中,<channel>元素是必须的,<item>元素至少要出现一次。<unage>和<tex-tinput>元素是可选的,是否使用要视具体情况而定。<channel>元素包含<title>,<link>,<description>,<im-age>,<textinput>,<items>等子元素。
4.基于RSS的图书馆个性化信息推送服务的模式4.1RSS订阅
1)网站信息分类订阅。
图书馆信息发布者可以将信息资源按照不同学科、主题类别聚合,形成RSS文档,从而为读者提供按分类查询的途径。读
者进人图书馆RSS服务页面后,便可以看到按类别排列的资源链接地址,例船舶海洋信息、材料科学与工程信息等按学科分类的信息。读者只需要用鼠标点击斋要的信息链接地址,从菜单中选择增加频道,粘贴上复制的信息链接地址即可[6]。
2)主题词/关键词订阅。
图书馆信息组织发布者可将信息按照主题词和关键词进行聚合,生成RSS文档,为读者提供主题词和关键词的查询方式。读者进人图书馆RSS服务页面,可以进行按照主题词和关键词的途径进行搜索,然后将搜索结果中需要的信息资源链接地址复制粘贴到新建频道中。
3)信息版块订阅。
图书馆网站上的信息资源通常都是按照类别等形成不同的信息版块,信息发布者也会按照不同的版块来组织信息资源并生成RSS文档。且很多读者只希望了解图书馆网站某一版块的
新书通报等板块。因而,图书馆RSS最新信息,比如数据库资源、
服务也可以提供按版块订阅,读者进人RSS订阅页面后,可以按照自己所需进行版块订阅,将版块的链接地址加人到RSS阅读器的频道中,那么该版块的最新信息就会源源不断地送到所需读者的面前。4.2服务机制
1)多元化的信息聚合。
图书馆的信息发布者提供RSS的信息源文档,不能仅仅着
新书信息通报、参眼于本馆的信息资源,如提供本馆动态新闻、
考咨询、数据库信息等[7],还要放眼于整个信息世界。如搜集网络上非常有价值的专业信息门户、其他门户网站的各种新闻信息阁或者针对某一专题对各个网站的最新信息进行聚合等等,然后把这些最新的信息及时地形成RSS文档,通过内容集结器的整合,用RSSfeed发送到订阅的读者面前。
主动性的信息推送。2)个性化、
RSS固有的特质为图书馆提供读者个性化、主动的信息服务提供了有力的工具。通过RSS,图书馆可以把网站上最新的信息主动推送给读者。但是,这一主动性也是有限度的,即通常是在读者允许的范围内提供的主动服务。这种用户允许的条件正好与图书馆提供个性化服务中读者的需求相对应。因此,只要读者在RSS服务页面提交了信息需求之后,RSS就会将与其需求的最新信息不断送到读者的桌面。
3)方便实时的信息互动。
读者在安装了RSS阅读器之后,就可以不断收集和阅读到来自图书馆发布的不同网站和Blog出版者更新的信息,而不必到每个站点上去查看网页。同时,RSS还提供了一个图书馆员和读者方便快捷的交流平台,每个人都可以很方便地发表自己的评论和见解。读者可以随时对信息资源的使用等提问,而图书馆员也可以实时的进行解答。在这里RSS真正发挥了其效力:获取、积累、过滤、交流。参考文献:
1.孙彩杰.RSS技术发展及其在图书馆中的应用[J].现代图书情报技术,2005,(6):83 ̄84.
2.张德杰,高厚礼.RSS技术及其电子商务应用分析[J].华东经济管理,2005,19(11):83.
3.吴振兴.RSS元数据在门户网站建设中的应用[J].现代图书情报技术,2004,(10):60 ̄64.
4.彭祯艺.RSS带来个性化搜索[J].互联网周刊,2004,(22):56.
5.叶新英,曹玲.RSS技术及其应用探析[J].科技情报开发与经济,2005,15(21):242 ̄243.
[6]柯青.基于RSS技术的个性化信息服务新方式-由雅虎看RSS在搜索引攀中的应用[J].情报理论与实践,2005,28(5):539.
7.姜瑞其.RSS在图书馆自助式数字参考咨询服务中的应用[J].情报理论与实践,2006,29(l):78一80.
8.黄艳娟.基于RSS的图书馆个性化信息推送服务[J].情报科学.2006年7月1024 ̄1025