电子图书编纂实验_以民国文献电子图书编纂为例
●王雅戈1,2,朱原谅1,何琳2
1.常熟理工学院图书馆,江苏(
常熟
215500;2.南京农业大学信息科技学院,南京
210095)
电子图书编纂实验
———以民国文献电子图书编纂为例
[关键词]电子图书;民国文献;Easy CHM 软件
[摘要]电子图书是近年来文献整理、图书出版研究的热点问题之一。在分析电子图书概念的发展变化,总结电子图书特点的基础上,以Easy CHM 软件制作民国文献电子图书为例,介绍电子文档批处理、电子图书阅读、关键词表编纂方法等方面的制作经验和技巧。
[中图分类号]G255.75[文献标志码]B
05-0061-03[文章编号]1005-8214(2009)
1
电子图书概述
简单而言,电子图书就是“以电子的方式储存信
[1]
。电子图书息,并以电子的方式进行阅读的图书”
具有检索功能强,阅读感觉好;管理简便,安全性好;内容依赖性强,出版成本低廉等特点。
据笔者对重庆维普期刊数据库刊数据库
[6]
[5]
和清华同方期
有关电子图书研究方面的论文进行检
索,最早是1992年顾犇在《中国出版》第4期上发电子图书的新趋势》一文。从检索结果可知,表的《
有关电子图书研究的论文数量比较多,到2007年底约有350多篇;从时序分布看,85%以上都发表在2000年之后,研究内容比较新;从期刊范围看,大约80%发表在核心期刊,研究具有一定深度。这些检索结果说明,电子图书是近10多年发展起来的信息组织、文献整理和图书出版领域值得研究的热点问题。22.1
应用Easy CHM 软件制作民国文献电子图书制作民国文献电子图书的意义
有学者指出,特色藏书、重点学科图书、不易保管的图书、流通率过高的图书以及期刊资料等是制作
[7]
电子图书的主要对象。这些对象适合本课题研究的
的英文是electronic book ,简写为e-book ,或ebook 。电子图书首次出现是在1971年,M ichael Hart 提出的“古腾堡计划”,第一次规模化地将纸质图书转化为电子图书。1998年,美国NuvoM edia 公司推出了手持式阅读器———“火箭书”(Rocket Book ),标志着电子图
[2]
如今,随着技术和内容书进入了高速发展的阶段。
[2, 3]
的发展,电子图书的概念也在更新和发展。现实
目标。民国文献是目前我国需要保护和开发的重要文献类型,具有极其重要的文献价值和紧迫的社会需要。制作民国电子图书具有重要意义。
民国农业文献是南京农业大学中国农业遗产研究室的特色藏书之一,它反映了该馆的独特性,将这些特色藏书制作成电子图书,能体现出文献资源建设的优势;农业科技史专业是江苏省重点学科,民国农业文献是重点学科支撑文献的重要组成部分,将其制作成电子图书,对学科发展具有重要作用;民国农业文献装帧形式多样,有线装、普通平装,开本形式差异很大,纸张、印刷质量差参不齐,价格和价值也有很大差异;民国农业文献在农史研究中利用率很高,文献损耗也比较大,容易造成缺失,保管困难。所以,
中的电子图书已经是无处不在,目前最流行的趋势是“到2010年90%以上的出手机电子图书。专家预测:
版社定期出版eBook ,当年出版图书的80%都有eBook
[4]版本。”
电子图书发展迅速、备受青睐的主要原因在于除了电子图书具有一般电子文档的特性之外,如存储密度大,占用空间小,保存期限长,携带方便等,它还
[基金项目]本文系国家社科基金重点项目“文化典籍整理与开发的智能技术研究(08ATQ002)”;江苏省社科基金项目(08TQB008);江苏省文化科研项目(08YB05)成果
·61·
从文献收藏和文献保障而言,制作民国农业文献电子图书很有必要。2.2
Easy CHM 软件介绍
以PC 机、手提电脑为硬件阅读设备的电子图书,其阅读器是利用电子图书最重要的软件,有学者在调查电子图书阅读器利用效果时发现,加亮、注释和检索功能是电子图书必不可少的基本功能,阅读器最好能满足使用者多方面的要求,比如高分辨率、高对比度以及较少的刺眼和反光。就电子图书内容格式,目前利用得比较多的是微软的CHM 文件格式、美国Adobe 公司的PDF 文件格式等。
Easy CHM 是国华软件推出的一款功能强大的CHM 电子图书快速制作工具。它几乎是CHM 的简化版,保留了CHM 的基本功能,同时更加适用于制作中文电子图书;它的文件占用空间很小,功能却很强,有目录、索引,同时具有全文检索及高亮显示搜索结果的网页集锦、CHM 格式的帮助文件、专业的产品说明书、CHM 电子图书等;它的价格低廉,可获得性强;它的通用性强,使用简便。因此,选择Easy CHM 制作民国农业文献电子图书比较适合目前的需要。2.3
民国文献电子图书制作中应注意的一些问题吴觉农先生所著《中国茶叶问题》一书在民国文献中是具有一定代表性的重要图书,现以该书为例介绍民国文献电子图书制作。
电子图书制作需要对纸质文献进行预处理,把它们制成规范化的电子文档,如扫描、文字识别、电子排版,有时还需要进行标引等。本部分主要探讨电子文档批处理的技巧,如Word 文档拆分、添加模板、制作网页文件。2.3.1
批处理
一般情况下,电子图书版式与其纸质底本应当相近,如字体字号、页眉页脚、页码顺序、图案等,在不影响阅读效果的前提下尽量保持一致。用Word 编辑图书一般是将一本书的内容录入在一个文件中,而Easy CHM 软件只能处理网页文件和纯文本文件,这需要把Word 文件转换成网页文件。但是纯文本文件不能带有版式编辑功能。为了使编辑成的电子图书有与原文相近的版式,同时又可以利用树形目录进行翻页浏览,就需要把整本书的Word 文件拆分成一页页独立的文件;如果手工拆分,速度慢,还容易出差错,因此需要编辑一个小程序,并在Word 的宏格式中完成。
·62·
当拆分Word 文件并完成校对之后,再把它们转换为网页文件。转换的方法可以是打开每一页的Word 文件再另存为网页文件,但这样做很烦琐,也可用Dreamweaver 软件把它们编辑成网页文件,但是这样一页一页加工时,如果图书的页数多,工作效率会很低,因此可以利用Word 在宏格式中进行批处理。如果要给每页图书再加上一定的效果的话,还可以选用模板添加功能,这个过程同样也可以批处理方式完成。
需要注意的是,拆分出的单页Word 文件,其页码顺序以及章节顺序号会因为Word 的编码方法影响而有时与原书不同,需要重新校对;EasyCHM 制作电子图书时树形目录中的最低一层目录名显示的是该页文件最顶一行空格之前的文字,因此,为了使目录中最低一层目录名显示页码,就需要给每页Word 文档的最顶一行标注页码。2.3.2
制作
当包括内容、格式以及添加背景等预处理工作完成之后,就可以正式制作电子图书了。在“新建”按钮中找到预处理好的文件夹,软件称其为工程文件,将工程文件添加到软件中,再进行“编译”“生成CHM ”文件(电子图书)。在编译之前需要注意的是,添加工程文件时所形成的目录并不是按照工程文件中的顺序排列各个文档,而是按文件名的汉语拼音音序排列文档,因此需要对生成的目录顺序进行调整,使用符号“←、→、↑、↓、+、-”等提高或降低该行目录的级次、位置,添加或删除某一条目录等。2.3.3
阅读
当《中国茶叶问题》电子图书制作好之后,就可以进行阅读,阅读时要打开编译好的文件。既可以按章节顺序翻阅,也可以直接选择某章、某节或某页进行阅读。本文要强调的是,用Easy CHM 软件制作的电子图书,其搜索功能很强,对读者查阅书中内容极其有用。如查阅《中国茶叶问题》一书中关于“茶园”问题论述的具体内容,在“搜索”栏中输入关键词“茶园”,点击“列出主题”按钮,在左下方即可显示出一些选择性标题,如“057-我国茶园经营概况中国茶叶问题”等等,共有“51”条,这表示在《中国茶叶问题》一书中共有51个页面出现过关键词茶园”,这一条是第57页的超链接,这种超链接共有51个。点击“显示”按钮,在右栏的原文中有“茶园”一词的地方都被标成了与背景明显不同的深蓝色,“第57页”网页中出现5个关键词“茶园”的
“
地方都被标注了亮蓝色,非常醒目,助读性强。2.3.4
关键词表(部分)
民国时期图书中所用的词汇与现代文献中所用的词汇大不相同,Easy CHM 搜索功能只能搜索关键词,不能搜索主题词。因此可能出现新的问题,即读者可能并不十分明确入口词的选取,检索时无从下手。现代人在检索民国文献时,检索入口词的选择是一个不容忽视的难点问题,如与茶叶经营和贸易有关的词汇茶商、茶贩、茶栈”等,有的是词频很高的词,有些是现在已经不用的词,如果不知道书中的用词情况,就无法检索到与原词匹配的内容。为了弥补软件在主题检索方面的不足,有必要为民国文献的电子图书提供关键词表。《中国茶叶问题》一书的关键词列表置于电子图书之后,供读者检索时参考选用,提高助检性能。关键词样例如下:
白居易茶中杂咏序茶贩代武中丞赐茶文茶经德川幕府茶商封氏闻见记茶神浮梁县茶树古今图书集成茶坞黄茶茶业经营金州茶叶经纪人茶叶贸易梁州茶园刘禹锡茶栈柳宗元卢仝唐国史补陆龟蒙唐书陆羽传陆羽唐书宪宗本纪吕温韦应物洛阳伽蓝记韦应物卖茶温庭筠茶歌蒙顶石花喜园中生茶记皮日休新唐书地理志琵琶行
新唐书食货志三月三日茶宴序元和郡县志
睡后烹茶忆杨同州文2.3.5
图文对照
民国文献的内容大都是繁体汉字,且很多没有标点符号,在加工成电子文档过程中,需要进行OCR
文字识别或文字录入,有的还要把繁体汉字转化成简体。文字识别、录入以及转化过程中不可避免地会出现一些错误,再严格地校对也无法完全避免误差。为了使读者能够对电子图书中的误差有效校正,有必要附上其原文的扫描对照图像,以备读者随时复查。3
小结
电子图书是数字化文献的主要类型之一,既可以为研究人员管理资料、编辑资料提供方便,也便于人们互换资料,是现代化条件下,个人最大可能地利用自有资料,并能相互提供学术服务,开展资源共享最有力的工具之一。使用Easy CHM 软件编纂电子图书不仅方法简单,易操作,而且批处理方法可以提高工作效率。如果电子图书标引时,能在书后列出该书的关键词,或编制其主题词表以及同时代的同义词表,或与现代语言对照的同义词表,则对于读者检索图书内容具有极大帮助,这将是电子图书编纂软件的进一
步发展方向。
[参考文献]
1]顾犇.电子图书的新趋势[
J ].中国出版,1992(4):61.
2]Frank Romano .E-Books and the Challenge of Preser-va tion. [EB/OL]. [2008-02-16].http://www.clir.org/pubs/reports/pub106/ebooks.html.
3]张海涛,耿爱静.电子图书的现状分析[
J ].情报科学,2001(
11):1218-1219,1222. 4]冯杏吉.电子图书保存面临的问题与思考[
J ].图书馆杂志,2006(4):26-28.
5]中文科技期刊数据库[
EB/OL]. [2008-02-16]. http://202.119.47.6/Visitnew.asp.
6]中国期刊全文数据库[
EB/OL]. [2008-02-16]. http ://dlib.edu. cnki. net/kns50/scdbsearch/cdbindex.aspx.
7]杨剑.高校图书馆制作电子图书的选书策略[
J ]. 图书馆理论与实践,2006(2):123-124. 作者简介]王雅戈(1965-),男,博士,常熟理工学院图书馆研究馆员,南京农业大学中国农业遗产数字化研究所副所长;朱原谅(1974-),男,常熟理工学院图书馆馆员;何琳(1980-),女,博士,南京农业大学信息科技学院讲师。收稿日期]2008-11-10
[责任编辑]肖
群
·63·
“[[[[[[[[[