基于语料库翻译研究和译者教育_杨晓军
2007年第10期
总第223期外语与外语教学
Foreign Languages and Their Teaching 2007, №10
Serial №223
基于语料库翻译研究和译者教育
杨晓军
(湖南科技大学外国语学院, 湖南湘潭 411201)
摘 要:语料库语言学已经从理论、描写和应用等层面对翻译研究和译员教育起着越来越重要的作用。基于语料库的翻译研究已成为当今描写翻译研究领域中新的研究范式。本文首先分析基于语料库的翻译研究的理论价值和应用价值, 然后介绍目前国外利用各类不同语料库进行译者教育的实践经验, 并结合我国的实际情况着重探讨如何利用和创建各类不同语料库以满足译者教育的需要以及今后研究设想。
关键词:语料库语言学; 基于语料库的翻译研究; 译者教育
Abstract :Corpus Linguistics has played a more and more important role in translation studies and translator education on different levels. Corpus 2Based Translation Studies has become a new paradigm for DTS. Both theoretical significance and practical values of CBTS have been briefly analyzed. Suggestions and practical guide are presented on how to compile and make full use of different corpora for specific translation purposes by introducing how the corpus 2based translator education has been carried out in foreign countries.
K ey Words :corpus linguistics ; corpus 2based translation studies ; translator education
中图分类号:H059 文献标识码:A 文章编号:10046038(2007) 10--05
0. 引言
词典编纂Halliday (1991) 指出“语料库语言学将数据收集与理论概述有机地结合在一起, 从而使我们对语言的理解发生了质的变化。”约10年后, Hunston (2002:1) 认为“, 我们可以毫不夸张地说语料库以及对语料库的研究在过去几十年里对语言研究以及对语言应用研究进行了一场革新。”
基于语料库的翻译研究(Corpus 2Based Translation Studies :CBTS ) 已成为当今描述翻译研究领域中一种新的研究范式, 在理论、描写和应用等层面对翻译研究和翻译教学以及翻译培训起着越来越重要的作用, 并激发了众多学者对相关问题进行研究的浓厚兴趣。自从20世纪90年代以来,Mona Baker 等学者们纷纷撰文深入探讨各类不同语料库在翻译研究中的优势和局限(如,Baker ,1993、1995、1998; Laviosa ,1997、1998、2002) , 并开展创建通用和专用翻译语料库, 如, 当今世界上第一个计算机英语翻译语料库(The Translational English Corpus 2TEC ) , 通过网址http ://ubatuba. ccl. umist. ac. uk/tec/可供研究人员免费使用(参见廖七一,2000; 丁树声,2001) 。日本也建成了英日翻译语料库(English 2Japanese Translation Corpus ) 。北京
(Chinese 2外国语大学中国外语研究中心已研制“汉英平行语料库”
(Chinese 2Japanese Trans 2English Parallel Corpus ) 、“汉日翻译语料库”
lation Corpus ) (王克非,2004) 。这几种语料库基本上可视为通用翻译语料库。目前可供翻译研究的语料库的研究发展趋势是研发为满
(Stu 2足不同翻译目的的小型专用翻译语料库和“学生翻译档案库”
dent Translation Archive ) 以及“学生翻译跟踪调查系统”(Student
) (2. 1部分介绍) 。
, 学术界已开展跨学科合, 联合研制满足不同翻译需求的各类语料库, 并成立了相应的研究机构(如, ICAME —the International Computer Archive of Modern and Medieval English ) ; 创办了相关的学术期刊, 如, IJCL —International Journal of Corpus Linguistics 和Journal of ICA M E , 等期刊; 并定期组织召开相关的学术研讨会, 如,CUL T —Corpus Use and Learning to Translate , 研究者可通过其网址—http//www. sslmit. unibo. it/cultpaps/paps. htm 阅读或下载第一次会议(1997) 和第二次会议(2000) 论文; TaLC —Teaching and Language Corpora 。此外, 一些学术杂志刊登越来越多的相关研究论文, 并出版
基于语料库的翻译研究特刊。
1. 基于语料库的翻译研究价值
受Toury 和Holmes 对翻译研究的划分图示的启发, 可将基于语料库的翻译研究大致分为两类:基于语料库的纯翻译研究(Pure Cor 2pus 2Based Translation Studies ) 和基于语料库的应用翻译研究(Applied Corpus 2Based Translation Studies ) 。Laviosa (1998) 指出“, 基于语料库的方法正在不断发展, 从理论性的阐述和实证性的实现发展成为一个连贯的、综合性的、丰富的方法论体系, 用于解决有关翻译的理论、描述和实践等一系列问题, 已成为当代描写翻译研究中的一种新范式。”Hunston (2002:123) 认为, 基于语料库的翻译研究大致可分为两类:理论性和实践性研究。就翻译理论而言, 语料库主要通过探讨某种意义从一种语言转换成另一种语言, 通过比较译语文本和其对应
的母语中的语言特征及其出现的频率来研究翻译过程。就翻译实践而言, 语料库为翻译培训提供了工作平台, 同时也为开发机器翻译和
作者简介:杨晓军, 副教授, 博士, 研究方向:英汉语对比与翻译研究, 语料库语言学收稿日期:2007-05-28
第10期
杨晓军 基于语料库翻译研究和译者教育
・ 52・
计算机辅助翻译等应用软件打下了基础。Baker (1993、1998) 和Laviosa (1998、2002) 等指出通过分析语料库翻译文本中大量的翻译现象, 可揭示并验证翻译中所存在的普遍现象(translation univer 2
(simplification ) 、(ex 2sals ) , 如, 句子结构“简略化”语义连贯“明晰化”(normalization ) 以及意思清晰plicitation ) 、谴词造句“规范化”“纯净化”
①
(Sanitaration ) 等特征。廖七一(2000) 认为“, 语料库不仅拓展了翻译研究的思路, 同时也为翻译研究提供了更加客观、科学的研究方法, 能更加有效地揭示语言的结构, 语法、词汇的特征, 分析译者语言习惯、语言的行业偏好, 连贯形式、主位-述位结构, 客观地阐释社会、文化和观念对翻译文本的影响。此外, 翻译英语语料库能快捷、可靠地发现和分析一定历史文化中的翻译规范, 分析性别差异、出版政策等对翻译策略和手法的制约, 同时还有助于探索翻译的普遍规律, 分析翻译文本的普遍特征, 预测翻译发展趋势与走向, 并对翻译理论家提出的假说进行验证”。
因此, 如今从事翻译研究和翻译教学的不少学者们极力主张把能否有效地使用语料库以及语料库分析工具软件看成衡量当代翻译能力和翻译实际水平的重要标准之一, 而且应把学会创建适用不同翻译目的各类语料库并能熟练使用语料库解决翻译中的实际问题作为翻译课程设置中必不可少的部分。为能使我国广大翻译研究人员和翻译培训教师能吸取国外利用语料库进行译者教育的经验, 笔者将已收集的相关信息作简要介绍。
2. , 译者教育, 而若能将平行语料库(parallel corpora ) 和可比语料库(com 2parable corpora ) ②、参考语料库(reference corpora ) 或监控语料库(monitor corpora ) 等通用语料库与学习者语料库(learner corpora ) 有效地结合使用, 将更有利于提高译者教育效果。
就翻译实践而言, 语料库可用来提高语言表达能力, 增强文化意识, 为译员和翻译专业的学生提供一个工作平台和参考工具。在这方面, 即使是单语种语料库也很有用。例如,Bowker (1998) 发现, 在对专业领域的理解、术语的准确选用以及习惯表达等方面, 借助语料库所完成的译文比仅用传统资源(如, 词典等参考工具书) 所完成的译文质量更高。Berardini (1997) 也建议, 传统的翻译教学应该辅助以大型语料库检索, 以便使翻译专业学生形成“意识”、“反射”和“应变”,
(Stu 2dent Translation Archive :STA) 以及“学生翻译跟踪调查系统”
dent Translation Tracking System :STTS) 的设计原理和研制过程以及应用价值。此项研究旨在收集、管理和研究学生翻译文本数据资料, 并对学生的翻译实际能力进行跟踪调查, 以便翻译培训教师深入分
而这些技能“使专业译员有别于那些手脚不熟练的业余爱好者”。
Zanettin, Bernardini 与Stewart (2003) 这两本论文集收录了CUL T 2Corpus Use and Learning to Translate 第一次(1997) 和第二次(2000) 学术研讨会各10篇主要论文。这些论文系统介绍了作者们分别在英国、法国、爱尔兰、意大利、葡萄牙、挪威、芬兰等国如何利用和研制各类不同语料库进行译者教育的直接经验。其共同点有:这些国家和作者所在的研究机构都设立了全国性、甚至跨整个洲的与语料库研究相关的大型科研项目, 且多数项目为跨学科、多途径联合开发, 如,the European Corpus Initiative (1991) ,the Network for European Corpora 等; 都研制出含自己母语与英语的双语或多语库; 多在外语院系大三或大四以及翻译专业研究生中开展基于语料库的译者教育。现主要评介以下两个研究项目。
2. 1创建“学生翻译文档库”以及“翻译跟踪调查系统”
(Stu 2Bowker 和Bennnison (2003) 系统介绍了“学生翻译文档库”
析学生在翻译实践中所遇到的问题哪些具有普遍性、哪些仅是个别
学生所遇到的问题。其设计原理仿真于学习者语料库。该项研究是由Lynne Bowker 于1997年在都柏林大学和渥太华大学开展的。通过与软件开发员Peter Beninson 通力合作, 已成功完成了相关研究项目。
该项研究的应用价值在于教师可根据不同翻译培训目的提取各类语料库来指导自己的教学实践。如, 通过提取含某一堂课里全班学生就同一原文文本所做的翻译文本语料库(text 2specific corpora ) , 借助语料库分析工具(如,Wordsmith Tools ,MonoConc ) , 教师可同时检查所有译文中相对应的部分。通过这种途径, 教师便可以确定哪些翻译问题是全班学生普遍感到困难的, 哪些翻译问题只是某一、两个学生感到困难的。也可提取其他类型的语料库, 如, 学生就某一专题所做的翻译文本语料库(subject 2field specific corpora ) 、涉及多个专题所做的翻译文本语料库(corpora multiple subject fields ) 、跨语言/(cross 2linguistic/same subject (longitudinal corpora ) , 教师可以判断哪些翻译问题已经解决了, 哪些翻译问题依然存在, 并以此作为评估学生翻译水平是否提高的标准之一。模仿此方法我们可以建立自己学生的翻译文档及其跟踪调查系统。
2. 2利用网络资源汇编“即用即抛型”翻译语料库
Varantola (2003) 重点介绍了在芬兰坦派勒大学(University of Tampere ) 翻译研究系翻译培训研习班里开展利用网络资源汇编“即用即抛型”语料库(disposable corpora ) 及其分析工具的经验。所谓“即用即抛型”语料库是指仅为完成某个单一翻译任务而特意编制的专用可比语料库, 而不是作为长期使用的文本语料库的一部分, 相当
(here 2now 2gone 2tomorrow ) 的语料于一种“今天用后明天即闲置备用”
库。这类语料库的特点是结构简单、规模小、不需要复杂的语料库标注、而且学生可自己动手编制(也可称之为DIY 2Do 2It 2Y ourself 2Cor 2pora ) , 但却是提高翻译实际能力的有效工具。此类语料库编好后, 实验报告说明常见的语料库分析软件—Wordsmith Tools —在翻译研究中具有不少功能, 如, 获取在翻译中十分有用的词汇搭配及语境信息; 检索较长的语篇单位来寻找语篇结构及衔接机制等信息; 有用的词表及收索词频率信息; 整个语料库文本中平均句子长度以及关键词词表等信息, 以便进行相关文体研究。这类语料库的主要价值在于增强译者对所作翻译决策和词汇选择等方面的信心, 并证实语料库中的例证能使译者较快地做出决策。
3. 如何开展译者教育
由于语料库语言学在我国普及程度不够, 许多高校还没有开设这门课程, 加之科研经费有限、现代教学设施不齐, 要像国外那样充分利用语料库开展译者教育的确有不少实际困难, 但并不是不可能。笔者认为, 在我国高校提倡和鼓励广泛开展利用语料库进行译者教育的教学改革十分必要, 而且任务急迫。这种教改思路正符合当代新的学习理念, 如, “自主学习”(autonomy ) 、“数据驱动式学习”
・ 53・
外语与外语教学2007年
[DDL—data 2driven learning , 读者可浏览其网页———http :www.web.
(learning as discov 2bham. ac. uk/johnstf/timconc. htm]、“发现式学习”
(CALL —ery ) 、“计算机辅助语言学习”computer 2aided language learn 2(learning as a form of research ) 的理ing ) , 以及“融学习与研究于一体”
念。以下主要探讨如何具体开展这些研究。
3. 1宏观决策问题
我国语料库研究工作起步并不太晚, 早在20世纪80年代就建成了两个颇具影响的专门用途英语语料库(ESP corpora ) :上海交通大学杨惠中主持的“交大科技英语语料库(J TEST ) ”和中国石油大学广州分校朱启波主持的“广州石油英语语料库”。可在以后的近20年中, 除上海交通大学研制的“中国学术英语料库”、“中国学习者英语语料库”以及华南师范大学何安平主持研制的“中学英语教学语料库”外, 几乎没有完成更多双语或多语库, 基于语料库的研究成果与国外相比还相差较大③, 而在国外从事研究和学习的不少华人在英汉语料库研究方面取得了不少成果, 如, 肖忠华(2004) 、朴松林(2004) 等青年学者。造成这些差距的原因是多方面的, 但主要还是宏观决策问题, 政府及研究机构重视不够, 没有设立像欧美政府及研究机构那样大力资助设立大型语料库研究工程, 缺乏统一组织和协调机制, 造成各自为政、重复建设的局面, 没有真正实现资源共享。为此, 笔者建议, 通过成立全国性的语料库语言学研究机构, 定期召开相关的学术研讨会, 创办相关的学术刊物, 开展跨学科、至国际间的合作研究, 采用“请进来、的工作。
3. 2改变教学、学习观念, 改善翻译课程设置
要有效地开展利用语料库进行译者教育的教学改革, 改变教学、学习观念是首要问题。教师和学生应该从传统的灌输式的教学和机械背诵式的学习方式中走出来, 深入理会当代新的学习理念, 积极主动地参与和配合相关研究, 不要因怕麻烦、怕太耗时间等因素而无动于衷。其次, 在目前的翻译课程设置中增开“语料库语言学”、“统计语言学”、“基于语料库的翻译研究”、“信息技术与翻译研究”等课程。
语料库语言学这门课程的目的在于普及语料库语言学的理论知识和实践技能, 重点应放在语料库的研制原理、赋码(annotation ) 、标注(tagging and parsing ) 方法和语料库分析工具的使用以及如何利用语料库进行语言和翻译研究。建议采用McEnery 和Wilson (2001) 的教材作为教材。该教材在国外许多高校均被采用, 而且其作者利用该教材开展网上教学; 可结合使用外语教学与研究出版社所引印的三本有关语料库语言学的著作。限于篇幅, 其他新增课程不一一说明。
3. 3有利条件
笔者认为目前在我国开展利用语料库进行译者教育是可行的、现实的。首先, 当代英语专业的大学生和研究生大多数都有较好的计算机知识, 对文字处理、扫描录入、网络搜索等技能并不陌生, 并有一定的语言学基础。这为编制语料库获取资源、使用语料库分析软件等提供了有利条件。
其次, 近年来国内外建立了不少包含汉语的平行语料库, 例如, Wu Dekai 等人在香港科技大学收集香港法院(LeCo ) 的记录资料而
(Wu ,1994) , 这是最早的包含汉语建立了“HKUST 汉英平行语料库”
的大型平行语料库之一, 到现在已被广泛引用和应用。附录一列举一些发布了的中文/外文平行语料库。借助这些语料库(其中1-7
均可免费使用, 尤其是2、4特别好用) 基本上可开展基于语料库的英汉、汉英译者教育。用于语料库标注和分析软件最常用的有:
CLAWS (Constituent Likelihood Automatic Word 2tagging System ) (http :www.comp. lanc. ac. uk/computing/research/ucrel/claws )
Wordsmith Tools :(http :oup.com/elt/global/isbn/6890)
PARACONC:(http ://www. ruf. rice. edu/~barlow/para. html. ) MLCT :AMultilingual Corpus Toolkit 。该软件包是由朴松林等开发的, 可通过其e 2mail 地址(s. piao @lancaster.ac. uk ) 获权免费使用。它特别适用于分析英汉平行语料库。
此外, 北京大学计算语言研究开发了汉语分词、汉英语平行语料库检索软件。
3. 4个案研究
为了更好地说明语料库在译者教育中的优势, 笔者从Babel 英汉平行语料库在网上提供的Paraconc. Web 利用带语境的关键词检索(KWIC:Key Word in Context ) 检索出具有研究价值的“develop ”、“re 2sult (vi. /n. ) ”和“results ”的对齐了的平行语料, 其检索结果见附录二、三、四。根据附录二提供的例证, 我们可开展以下教学活动:
1) 要求学生在译文中找出“”的翻译对等语, 并总结归纳, “develop ”的翻译和搭, Microsoft Word 编辑中的替换功能将de 2, 要求学生根据译文填出原文中所缺的词项。
(3指通配符, 代表其3) 要求学生自己动手检索含“develop 3”、
所有形态变化形式) 的对应语料, 找出其在“时、体、态、式”上的使用和翻译转换规律。
(4) 要求学生通过英汉平行语料库检索“! 发展”“! ”代表其作动
词和名词的所有形式) 的语句, 总结归纳出其与“develop 、develop 2ing 、developed 、development 、grow 、growth ”等的翻译转换规律。
同样, 根据附录三和附录四提供的result (vi/n ) 和results (n ) 检索结果, 我们可开展以下教学活动:
1) 比较result 作动词和作名词的使用频率, 总结其搭配规律和翻译转换规律。
2) 比较result 作名词时其单、复数的翻译有何不同; 一般词典中是否有此用法比较?
3) 要求用同样的检索方式, 找出近义词“result ”、“outcome ”、“consequence ”和“aftermath ”的意义相同和不同之处; 探讨如何准确地翻译才能体现出它们所蕴涵的语义韵律(semantic prosody ) ④特征, 尤其是其否定语义韵律, 并找出搭配模式与语义韵律之间的关联。4. 今后研究设想4. 1研制“汉英日多语语料库”Johansson (2003) 认为“, 语料库的类型数量是无定的, 可能引发的研究问题和应用领域也是无限的”, 提出建制多语语料库的“钻石
(the diamond model ) 和(the star model ) 用于跨语言模式”“星光模式”
研究和翻译研究, 在原有的英语-挪威语平行语料库(ENPC —The English 2Norwegian Parallel Corpus , http//www. hf. uio. no/iba/pros 2jekt/) 的基础上扩建含德语的多语语料库(http//www. hf. uio. no/german/sprik/) (因为德语与挪威语有不少共性) 。笔者认为我们可
以在汉英语平行语料库和汉日翻译语料库的基础上建制“汉英日多
第10期
杨晓军 基于语料库翻译研究和译者教育
・ 54・
语语料库”, 这将为跨语言描写研究和翻译研究提供丰富的资源。4. 2研制“同一作者/译者/文本专用翻译语料库”Malmkjaer (2003) 介绍如何利用《安童生童话故事》中的《豌豆公主》的14种英译本建成的专用语料库, 研究译文的措辞的创造性和表达的新颖性。
王克非(2002) 认为, 语料库解决了大量语料存储的问题, 对于翻译工作者或翻译教师来说, 最为便利的莫过于将所收集多种译本存储于其中, 并随时可调出加以对比研究。名著重译或复译是非常多的, 一般人很难收集齐全, 如《简爱》有近20个译本《傲慢与偏见》, 的译本也有十六七种之多《红与黑》, 译本据说有人收集了20个以上, 莎士比亚戏剧中《汉姆雷特》的汉译本最多, 达到30种。还有诗歌的译本, 无论是英诗汉译还是汉诗英译, 都常有多种译本。将多种译本收集到双语语料库或翻译语料库里, 就会大大方便翻译的研究者和教师, 对从事翻译工作的人也大有裨益。孤立地看一个译本, 往往不能看出什么, 多个译本综合到一起看, 就可能有新的发现, 或对翻译对比教学有帮助。
此外, 笔者建议将《红楼梦》的多个英译本编制成专用语料库以便利其相关翻译研究。也可将某一文本类型的专业翻译人士的译文
(model translation corpora ) , 供学生比照编制成“示范型翻译语料库”
自己的译作, 改进译文质量。
4. 3创建“中国学生翻译测试文库”仿造“中国学生者英语语料库”(级考试考生答卷中取样) , (试”、“翻译资格证书考试”, 人事部、民政部等举
办的此类考试) 中的翻译答卷里进行选材, 汇编成“中国学生翻译测试文库”, 对其进行简单标注(主要指Mini Markup 和Error Markup ) , 即可用于学员翻译考试培训, 相信一定能够收到良好的教学效果, 同时也能产生较大的社会效益和经济效益。不过, 笔者建议, 这类考试今后最好借助多媒体设施进行, 以便答卷统一以电子版形式储存。这将大大缩短建库时间。
5. 结语
②这两个术语有不同译法, 也可分别译为“对应语料库”和“类比语料库”。③有关我国语料库建设及基于语料库的研究调查, 参看王建新(1998) 、杨晓军(2003/2006) 。④有关语义韵律的介绍和分析参看Tognini 2Bonell (2001:113-116) 。
参考文献:
[1]Baker , Mona. Corpus Linguistics and Translation Studies :Implica 2
tions and Applications [A ].In Mona Baker , G ill Francis &Elena Tognini Bonelli (eds. ) Text and Technology :In Honour of John Si nclai r [C].Amsterdam :JohnBenjamins ,1993:233-252.
[2]Baker ,Mona. Corpora in Translation Studies :AnOverview and some
Suggestions for Future Research[J].Target ,1995(7) :223-243. [3]Baker , Mona. The Role of Corpora in Investigating the Linguistic
Behavour of Professional Translators[J].International Journal of Corpus L i nguistics ,1998(4) :281-298. [4]Bernardini ,Silvia. A “Trainee ”Translator ’s Perspective on Corpora.
Paper Presented at Corpus Use and L earni ng to T ranslate Held at Bertinoro ,November ,1997.
[5]Bowker , Lynne. Using Specialized Native 2language Corpora as a
Translation Resource :APilot Study[J].Meta ,1998(43) 4.
[6]Bowker ,Lynne &Bennison ,Peter. Student Translation Archive and
Student Translation Tracking System :Design,Development and Ap 2plication [A ].In Federico Zanettin , Silvia Bernardini , &Dominic Stewart. eds. ) Corpora i Education [C].Manchester :[,M. A. K. Probabilistic Grammar[A ].In
(eds. ) English Corpus L i nguistics [C ].and New Y ork :Longman,1991.
[8]Hunston , Susan. Corpora i n A pplied L i nguistics [M ].Cambridge :
Cambridge University Press ,2002.
[9]Johansson ,Stig. Reflections on Corpora and their Uses in Cross 2lin 2
guistic Research[A ].In Federico Zanettin ,Silvia Bernardini and Do 2minic Stewart (eds. ) Corpora i n T ranslator Education [C].Manch 2ester :St.JeromePublishing ,2003.
[10]Laviosa , Sara. How Comparable Can “Comparable Corpora ”Be ?
[J].Taget ,1997(9) 2:289-319.
[11]Laviosa , Sara. (ed ) The Corpus 2Based Approach to Translation
Studies , S pecial Issue of Meta ,1998(43) :4.
[12]Laviosa , Sara. Corpus 2Based T ranslation S t udies :Theory , Fi nd 2
i ngs , A pplica 2tions [M ].Amsterdam :Rodopi,2002.
[13]Malmkjaer , K irsten. On a Pseudo 2subversive Use of Corpora in
Translation[A ].In Federico Zanettin ,Silvia Bernardini and Dominic Stewart. (eds. ) Corpora i n T ranslator Education [M ].Manch 2ester :St.JeromePublishing ,2003.
[14]McEnery , Tony &Wilson ,Andrew. Corpus L i nguistics (2nd edn )
[M ].Edinburg :Edinburg University Press ,2001.
[15]McEnery , Tony &Baker ,Paul. Corpora , Translation and Multilin 2
gual Compu 2ting [A ].In Federico Zanettin , Silvia Bernardini and Dominic Stewart (eds. ) Corpora i n T ranslator Education [C ].Manchester :St.JeromePublishing ,2003.
[16]Tognini 2Bonell , Elena. Corpus L i nguistics at Work [M ].Amster 2
dam :JohnBenjamins ,2001.
[17]Varantola , Krista. T ranslators and Disposable C orpora[A ].In Federico
Nanet 2tin , S ilvia Bernardini and Dominic Stewart (eds. ) Corpora in
Translator Education [C].Machester :St.JeromePublishing ,2003.
时代在变, 语料库也随之而变。总的变化趋势之一是:语种从单语转向双语和多语, 从欧洲语言扩大到非欧洲语言, 尤其是欧洲小语种和南亚语种。McEnery 和Baker (2003) 调查表明, 英国翻译市场对非欧洲语言翻译的需求中, 汉语排第一; 翻译需求最多的文献体裁却并没有被现今的语料库所收录, 如, 需求量第三大的文献体裁———结婚证/出身证/死亡证明等从未被列为平行语料库的主题范围。这一调查结果为今后的语料库建设提供了借鉴意义。随着我国出国留学人员人数急剧上升, 对毕业证、学位证、成绩单、资信证明、邀请函、录取通知以及各种关系的公证书等的翻译需求越来越大, 应该收录双语文本库中。当然, 任何语料库都不是万能的和包罗万象的, 因此, 要慎重使用, 并与其他参考工具结合使用才能发挥其最大优势。总之, 好的语料库还需好的使用者。值得注意的是, 在采用基于语料库的研究方法时, 切记此忠告“Only corpus 2based , Never corpus 2bound ! ”。
注释:
①这些术语作者由本文翻译, 仅供参考。
[18]Wu ,Dekai. Aligning a Parallel English 2Chinese C orpus Statistically with
Lexical Criteria [P ].In 32nd Annual Meeting of the Ass ociation for C omputational Linguistics ,New Mexical ,USA ,1994:80-87. [19]丁树声. 浅谈西方翻译语料库研究[J].外国语,2001(5) . [20]廖七一. 语料库与翻译研究[J].外语教学与研究,2000(5) .
[21]王建新. 语料库语言学发展史上的几个重要阶段[J].外语教学
与研究,1998(4) .
[22]王克非. 语料库:翻译研究新途径[J].外语与外语教学,2002(9) .
・ 55・
外语与外语教学2007年
[23]王克非. 新型双语对应语料库的设计与构建[J].中国翻译, 2004(6) :73-75. [24]肖忠华. 英汉语中“体”的分布考察[A ].王克非主编. 北京:外语
教学研究出版社,2004:108-118. [25]朴松林. 对应语料库的对齐、标注与应用[A ].王克非主编. 北
京:外语教学研究出版社,2004:21-27.
[26]Yang , Xiaojun (杨晓军) . Survey of Corpus 2Based Researches in
China , Paper Presented in Corpus Linguistics 2003,Lancaster Uni 2versity ,U K ,March ,2003,also in Paul Welson &Tony McEnery ,et al (eds. ) Corpus L i nguistics A round the Worl d [C ].Amsterdam :Rodopi ,2006.
[27]杨晓军. 语料库使用实用指南[J].中国英语教育,2004(4) .
180,660英文词和192,560汉字;
4) Babel 英汉平行语料库(The Babel English 2Chinese Paralle Corpus ) :
(2000,10-2001,2) 等刊物的文章在兰开由肖忠华收集《英语世界》
斯特大学建立, 包括约253,633英文词和287,462汉字。(网址:www.ling. lancs. ac. uk/corplang. Babel/babel. htm ) ;
5) 汉外多语翻译库(Multiple -Translation Chinese Corpus ) :由Huang Shudong 、David Graff 、G eorge Doddington 等人所建立, 并通过LDC (Linguistic Data Consortium ) 发布的汉外多语翻译平行语料库, (网
址:http ://www. 1dc. upenn. edu/CatalogEntry. jsp ? catlogcatagId =
LDC2002T01) ;
6) 香港新闻平行文本语料库(Hong K ong News Parallel Text Corpus ) :由Ma Xiaoyi 收集香港汉英双语新闻所建立, 并通过LDC (Linguistic Data Consortium ) 发布的平行语料库, (网址:http ://www. 1dc. u 2penn. edu/CatalogEntry. jsp ? catlogcatagId =LDC2002T46) ;
7) 大规模汉英语平行语料库(Large 2Scale Chinese 2English Parallel Cor 2pus ) :由中国科学院软件研究所承担的国家863项目之一———建立大规模汉英语平行语料库;
8) CONUL EXID (the Commercial Press and Nanjing University Lexical Database ) :由南京大学与商务印书馆联合创建的英汉双语词汇数据库, 主要用于双语词典编纂研究领域;
9) 汉英语平行语料库(Chinese 2English Parallel Corpus ) :由北京外国语
附录一:中文/外文平行语料库
1) Sinorama 汉英平行文本语料库(Sinorama Chinese 2English Parallel Text Corpus ) :较早的平行语料库, 由高照明收集台湾Sinorama (光华) 杂志双语文章所建立的(网址:www. cio. nist. gov/esd/emaildir/mt 2list/msg0032. html ) (G ao ,1997) ;
2) 伯明翰(Birminghan ) 英汉平行语料库(English 2Chinese Parallel Cor 2pus ) :由Wang Lixun 收集多种文体的文章而建立的平衡平行语料库, 其目前规模为一千万词, 计划扩展至一亿词(网址:www. blam.
ac. uk/lxw715/eclept/ParallelCorpus. html ) ;
3) 兰开斯特汉英平行语料库(Chinese 2English Parallel Corpus :CE 2PLC ) :由朴松林收集英国政府英汉双语版、中国教育部的汉英宣传资料、以及新加坡联合早报网上英汉双语版文章所建立, 包括约
大学中国外语教育研究中心王克非负责承担国家人文社科重大科研
课题;
10) (Bilingual Corpus ) :由北京大学附录二“:develop ”检索结果(, 51
Inevitably they will do everything they but they will do very to As well ,there for ,as we get older ,our cellular DNA mutations and suffers other changes ,which for why we are increasingly likely to develop To avoid the capital outlay or the hardware in the office ,they set out instead to develop a switchboard based on a PC computer.
Then ,realising the market was awash in such products ,the company looked at ways to use its experience in voice mail ,interactive voice response and unified messaging to develop new subscriber 2based ser 2Andrebe lieves designers need time to develop their skills and style.
, 却很少会去培养自己内在的价值和注重个人的成长。
我们也有理由相信, 随着年龄的增长, 我们细胞的DNA 会渐渐累积变异而发生其他改变, 这可以说明为什么我们随着年龄的增大越来越可能罹患癌症。
为了避免资本支出, 即办公室的硬件开支, 他们着手开发一种基于个人电脑的交换台。
之后, 该公司认识到市场上充斥了这类产品, 于是就着眼于利用自己在语音邮件、互动语音反馈和联合传送信息等方面的经验, 来发展基于用户的新型服务项目。
安德莱相信, 设计师要形成自己的设计技巧与设计风格需要时间。
2345
附录三“:result (vi. /n. ) ”检索结果
123
(Result :thefaithfuls outnumbered the cheaters 32to 21. )
In 1977, Hutchison Whampoa Limited was horn as a result of a
merger between Hutchison International Limited and Hongkong and If successful ,this would result in a child free from the disease which has a unique genetic blueprint and one made up from equal contribu 2Other offers will no doubt result from a recent traveling show of Sand ’s work “, Ad Fontes :The Art and Projects of Vebjorn Sand ”, which was during October at the Nordic Heritage Museum in Seat 2A second group came up with the same result at about the same time ,and the journal Science named the accelerating universe Dis 2(调查结果是:忠诚者超过了不忠者, 二者的比例是3:1。) 1977年, 哈奇森国际有限公司和香港惠姆波船坞有限公司合并
组成了哈奇森・惠姆波有限公司。
如果成功的话, 以这种方式创造出来的孩子就不会得此遗传病, 因为这种疾病有一种独一无二的基因型板, 其构成来源于原配毋庸置疑, 最近举行的桑德作品巡回展将使这位设计师迎来更多的客户。这次全称为维比昂・桑德艺术与工程展的展览10月份将在华盛顿州西雅图北欧传统博物馆举行。
大约在同一时间, 另一个研究小组也得出相同的结论。美国《科学》杂志将宇宙加速膨胀这一研究成果推选为1998年年度重大4
5
附录四“:results ”检索结果
12345
Application and Perseverance G ive Results
The greatest results in life are usually attained by simple means ,and
the exercise of ordinary qualities.
What K illed Eugene O ’Neill ? Autopsy Results Show Playwright Suffered from Rare Disease.
Rossner has that a treatment that works for one person may have Creature Comforts (1989) had gorillas ,bears and hippos speaking the words of human visitors to a zoo ,with sad and hilarious results.
勤奋有恒结硕果
人生最大的成就通常是靠简单的方法和运用一般的才干获得的。
是什么杀害了尤金・奥尼尔? 尸检结果表明这位剧作家患的是罕见病。
罗思纳认为, 适合某个人的治疗方法可能会对另一个人产生灾难性的、让人气馁的后果。
(1989) 中, 有猩猩、在《畅快》熊和河马, 它们来动物园参观的人
说一样语言, 故事结局既悲伤又欢闹。