机器翻译与文本编辑:进展与展望
语 应言 研用究
机
翻译器文本与编 辑:餍与展望
进口董
摘
要 :全球妍进程的化加 快促,国际交流使得 日变益重要,这 不可 避地把免 笔译口者向 了高推求的需 台平基 ,其承于
担着连
接 不同语言 国家交流 任务的充 当重并要角 色。而 然在, 现实一跨语 这交言际过的 程中很 多的,障随碍显之现 ,盖涵 域领也较 广,从 济问题经 、语用学及一致性 问 题翻译速到度 问的题换言之。 大笔的资金, 大量的和精力需 投要入翻到译 之中,保证翻译以 速的度和质 量。事实上 ,人 力 固然 以可做到很 多但翻译,文本各 面方要 迭都到完 却美可强不求,此 时,而 基
于电脑 的 工和具MT ( 机 器翻译) 便应 而生运 以, 最大度 限的足翻满译求。从需字意面思理解来 机器译翻 :电由来脑成 完
的翻译
其 工,原理遵照作一套体系 —首—先 “ ,析 分语言源建以 内立表部 征( i tne r na 1 erp r e se n ta t io n,)然后用 特有
方的法运这些用 部表征来最内生终成 目语言标。 ” 关键 词
: 器 机译翻人 工创造 力 亿翻
库
一
、电
脑 和 人 翻 译 的 工关 系
活
自 然更。重 要 的是, 从上图可 得 知 在,电脑 的 辅 下助 ,
在
翻 译的 历史中, 电 和脑人工 翻译之 间 的 系关可 追人 翻工 的译质 得量 了显著改善 到。正w u 如提 “所 不 的同翻 到溯1 世纪 ,7 可源 远谓长 流。而直到2然 0 纪5世O 年代第 一译 文本 要 使用 不 同 的 翻译 工具 ,对症 下药 ( Ri gh tt o o l s 个 翻机系 统诞才 ,生可 以机 翻 的说发 展 成非 熟常 慢缓。
f o
rr i g t ht s ka s —)—在某种度程上,脑电人对工翻译
最起初 机 , 翻的 文 质稿 偏量 低至 于无 法 采纳以 。当 时, 到机了 补 充作 。 用( wu, 20 1 ) 翻2 系统 只 录 有 限收 种语几言 的 字典 。后 ,随 来在着线 资
源 日益的丰富 , 机翻 质 的量 逐渐 提高并 开 始广为所 用 。 既 电脑然 与人 工 翻 译 的 关 得系到 了 印 证 那, 么 他们 之 间 如 有何效 合作 并做 高出质 量 的 翻 译 被 纳 入议 。题如 下
M图a t t i e h sse n,2 00 :l11 4 ) : 尽 管 机 翻 曾 经给 人们 的 印 象 是只要 按 下一 钮按就 以 可 了(
( H tu hc i s n2 , 003 ) 这,种 翻译 法 方 确 为 实 译翻 事 业 供
提很多了助和帮捷 便如下图所。示 ( w u,
2 0 1 2) :
上从 可图 看 以出电脑 和人 工在翻 译 过 程 的工 作中 分显 然,在翻 译过 程中, 鉴于机 翻与 人 工 翻译 的 关 系 配,在图 表最 的上 可 以端看 电脑到 扮 演的角 色是 “行 动 以
及他 们 各自独 立 翻译 时 表 现的,不 可否 的认 是, 电 在脑 者 而” 人角的色 “ 是受益 ”者 ,也 就 说 在是 这 一阶段 , 电
做简单翻
时译 比 工更胜人一筹 。 然而, 源 语言当件文 复 脑 做的了主 要 的 翻 译 工 作。 而 整然 个图表 显 示出 脑 与电 人 工
杂程度 逐 渐 提高 , 机时翻 质 的 也 量之 下 随 ,降 因此 以看 可的关 在不 系同阶 产段 了变 生—化 — 电当 脑担承 了主 要翻 的
,文件出复 杂性仅仅的 对工翻译人 生不 产明的显影响。也 工作译而没有 工 人入时介 ,人 便是 “益 受者 ”;当电做脑 就是说, 不对 文 本 ( 从同简单到 适中再 到杂 )复翻译 的,
部 分 的 翻 译 ,时 人 是 决策 ,者 也要做 些 一 前期 编 辑和后 期
工 人表 的现更平衡 些一 当。 翻译杂文 本 复, 诗歌如、理 编 论 辑,这些会 在 本 文 部分后讨 ;当人论工做 所有 的 译翻
和 谚语 时在, 文体 学、语 义 和学语 学用 方面 人 工 现表 更灵 时电脑变为, “ 工具”, 而 人则 是 “行者动 ”, 例如键关兰 詈
兰
…
…
呈
词和典字的译翻。
的译者 对 某于 些词 汇 或 句 子 结 构 有其 更 倾 的 翻 向 译, 样
这最终 翻 在译过 程中可 能会 导 致文体 或 词汇 选 的不 择一 致 。 不 可否 的是认 机,翻 以可做 到 对 概 念、 复重和 常见 的
、二前 期编 辑 和后期编 辑 前 文 提 到 , 在 做机 器 翻 译时 , 前 编 辑期和 后 期 的翻
译需 人 工要成完 因为,电脑 的 能程度智 人与相 类差甚远,
句
结子 的翻译构持一保 。但是 致H u, tc h in s提 出后编辑期
它 们 无 法保 证 对 每 个 字 、词 进 行恰当 合 适的 翻 译, 也 是就 的 外另 个一 弊 —端—如 果 翻忆 库中存 储的 是 不 当 恰字的或 说 , 一 个 单词 在一 种 语 言是内 多 义的, 因 此 在 翻, 译 时 语 句 子翻 ,译 后 做 编期 辑 的译者 要 就 停 的 修 正 这不 些 问 , 题
域 具 和 体概念 要 进 行相 的考 量应,这 是 电脑 无 法实 现 的 。
这样 人 们 的工 作 就 辅 助 是电 脑而不 是 机翻 的受 益 者。他也
因此
, 在 为机 翻 做前 期编 辑和准 工备 时作, 人 们 需 要 对 因
此 提 出 项一解 决 方 案 , 一有定 译 技 能翻 的 期 译 者后可 句以 子进行 “ 分 割 以 理处 复 杂 的意 群 、 能可产 歧生义 的语 替 代 业 专译者 来 做 期 编 辑后 ,他 们也 可以接 受 定一 的培 训 义 模糊 的词汇 和 其他 类似的 情 况” (Ma Dc on lad 1,9 7 9 : 9 卜 1 43) 。 Hu t hc in s 也 指出 前期编 辑 可 应 于 用不同 况 ,情 例 如 “: 某个 单 词 是 否 具 有 特 定 含 义 某、个 名 称 是 否需 要翻 译 以 复及 合名 的 词界限 ” , 插以入 “ 标点符 号 ” 或者把 “长 句分为短旬割 (” Hut hc nis ,2 0 03) 。除了对 语源 言 提以高 译翻 水 平 。当 然 后期 译者 的 金 可佣能 会 相对 低 一
些。 ( Hu tc h i n s,2 00 3 )
三后、 编 辑期 提升 翻忆 库 质
量
了为 提 高翻 质 机量 人 ,和工 脑 的合电 至关作重 要 ,
因此 基语 言本身一于直 在化变( 新词, 造创 性 法 用 不 的断
a
— 的r 翻译 以加注意 外 尽, 管有 写拼 和 语 法 检查器 人 ,工 翻译 出 现 ) , 人 们在 翻 译 的 程过 要中做 出一 定 的调 整。
B
il l e  ̄l U 了一举些子: “ 字例 典自动 存储 和 检 的索 题 ” 问 时 也 应 该 避免 误 的拼 现 , 象 为因 “个 别的 单 词 能 可无 法 为H 微 语 学 意言义 微和语 法 ” 尽。 这管些 例 在子 十几 前年 电脑 识别 ,一 旦 发 生 错识 将 会对 后 期的 翻译 产 很生 大的 影 和“ 响 ” 。 如果 期 前编辑 打 下好 的良基 础,后 期 编 的 辑工 量作 就己经 出提 ,但 到现在 仍 然 适 用, 为因 语 一言 直 在 化变, 将 会有 显 著 的 少减。 H u t c ih s n 还指 出 ,理 论 上 ,在 做 前期 这 致 导 翻 译 的 量 质也 一 直 提 升 没有终 (点 Ba r —H 】 1 ei1 , 9 6 09 :1— 1 6 3 ) 。 oJ s e slS On 也提 出了 类 观似 :点扩大 字 编 典辑 时, 人 们 需 无 目对 语 言标有 广 泛的 了解, 然 而 事 实 1上, 定 一的 解了 还 是必要 的这, 对后 期 的翻 译 有 一 定 的帮 涵 盖的方 面和 丰富语 法 于 对 提高机 翻 的质 量 分 十必要 ,这 助 。 是 但,前 期 编辑 有也一 些 弊 仍端 然 被 为认是 权 宜之 包 : 括 “ 设计出符 合 双 的语 形态 学 的 、句 法 的 语 义 和的
计编 ( 。 Ma c
D on al d ,1 9 7 : 91 9 1—4 3
)
码、句 法 分 析的规 则、 自 动 句的 子语 法 析 分规则 和 多 选 规
完 成前 期编 辑 之 后 , 电 脑就 可 自以 进 行 翻 译 , 尽 则 主” 。他还 认 为在 机翻 过 程 中, 对 分 析 最比 适 合产 出高质 管 仍然 会 有 些一小 误的 。翻前 期 编辑 主 要专注 于 一些 省 量 的 翻 译。 过通 比 目标 语较 言 的 同不 本 ,翻 忆译 库 研 的发 略 、 词 代 和 一致性 等 问 题H。 tuc h i sn认 为 后 期 编 的辑工 作 者就 可 有以 不断 富 的数 据丰资 源 翻以 在 译源语 中言 出现 的
J o s es1 s o n1 , 7 9 :卜1 5 ) 3。同 量是 以减可 少的 —— “ 稿文越 准标化 ”, 术 和语 词陈 滥 创 新的 表 达 、 词汇 组 合
(调 越多 文, 稿就越老 且套 缺 乏 造性 创, 翻机的准 性就确 时 ,着随 技发展 ,科自动 的后 编辑期可 以由 电来脑 成 ,
完越 高 这,样 一 来 后,期 编 辑的 校 正工 作 就 也相 应减少 了 但 同 ,样这 对是 未 发 展 的 来 望 展。
( u t c hH n s ,2i0 03 ) 。 脑电擅长最 的工作是标准就化 翻 的
具 说 体来 近,年 来 , 评估 电脑 自 动 期 编 辑 的 后项目 层
译 , 所以它更擅 长处理一 规些矩的 子句,因为创 性 的翻 造 出 不 穷 。此 由, 究研 人员 通 过 结 构 分 可 析以寻 找 更 多有益 o y o n人等在20 0 8年做 过一个 名译 没 有 程 序可 循遵 且,不 预 可见。 换 之言 , 忆翻 库 (翻译 于 高提翻译质 量 的法方 D
记 。 库 )忆— — 一种 “ 存储 谓所 句 子 ‘的 断片 的数 据库, 为 《 通过后 期 编 辑 提 高 自动 机 翻 质 量 的 技 术: 分 析 师 译和
例 如 句 子 或 类似 于 句 子 的语 言单 位 — — 题 、 标题 目 者 或列 者 经验》 的 究研项 目。 这个 项 的 目 研究人 员比较 了 电由 表的脑项 ,这些各 片断都是现成 的参可 的翻译 ”,考 (翻 译 和 人工 分 别 做 出 的后期 编 辑 译的本 , 现 发 前者的翻 译 质的 低 于 译 和 者分 师 析 可 认的 可 被 采 纳的 标 ,准而 所有 的 记 库 忆2 0,1 2 )它 的 研 者发不 可 能 输 入 所 单有词 的 有所 意 量 思,“因 此当面临,造 性创不 常见或词组的或 子结构句时 ,翻 忆 库的 存储 数 据就 显 不得足 。 人工 出的后做编期辑处都甚 于至于高标准 此 ” D o(y no
e
t a l , 2 0 8 0) 从 这。 研一 究 果结 得知 机 翻 始 终 不 人 意 尽, 即
与
前 期 编 辑 不同 , 后期 编辑 一 般 译由者 来 完 成 , 因其在 辅 助 人工 翻 译 方 面还 很有长 路的要 走。他 们还 做 了一 为 语双技 能获的 得 靠 是时 积间 累 而来,这 一点 专业 译者 比 调个查 ,结 显 示果一 旦 经过 人 的工 后 编 辑期 , 们 人还 是 更 非 业专 者更具优势 (译H u t c i h sn 2 ,0 03 。 )因 ,人 工此 在 倾 于 使 用向 机器 翻 译, 而 且 当时 在 阿 拉 伯 语和 英 语 机 器 翻 翻 中译被入引 ,也导就 致“翻 译成本提 ” (高 c D o nM a ld , 1 97 9 9 卜1 : 4 )3 。 当然 , 其 这中也 包含前 期编 的 辑费用 。 中 译 无并不 可 采 纳 的 自动 后 期 编辑 译 。本该 项目 的 验实有
一
定
的 局限性 , 但 是,Ar i d n aa 出 了 得似相的 结— — 大论多
D L 系 外另, 者译 们 做在 后 期编 时 需辑 要 保 一持致 性 , 因 为 不 同 的数 翻 机 统系 与 后 期编 辑 的 配 合 不 如并 翻忆 库 据 和 S数
语言 应 研用 究
统 的Mu l e r m 默t契 。她 提 了两个 改善建 议 出:一 , “第在
线 翻 译 校 正 工具 ”对 “简 单 的错 误 断 诊和不 明 显的错 误
分类 是有帮” 助的; 第,二 “自 的动翻规译 则完善工 具过 通追溯译文 错的误到 始原的翻译 则规和条 词录 入,行进修正
数多属 词于汇形和 态句法 错误的” 例,如 “用 顺词 序错 误 或未遵 循语言间转换则 ” ( A规r a id n ,a20 0 )。 然9 而 论无
如
何,大多 时候 ,人数们 机在翻 的程过 中仍然挥发着不
替 代 的可作 , 因用 为 很 多不同 领 域 的 调 整, 从 功 能语法 到 对 翻 忆 库 的 扩充 , 都 要需人 完为 成, 并 人且工 智 能 度 是 电程
脑无法及的企,况且 不语同的言达表 法方不可也预。 知
四机 器、翻 译 的 未 来
尽管 翻机有 一相段 对 较长的 史历 机,翻 软 件是 处
还
初级 于阶段且 人可们以想 像工人翻译 的 未 也来 是 “许脑 电输
出 较 对和机 ”器 以可做些一 工人的译翻工作 且具 有定 一的 准性确( C h m a p ol li no , 021 0 )。尽 管实践证明人们 在搜索 信时息 使用机翻 软件有很的 强包的 容 ,但机翻 是性
否可以满 足 大 的广市 场需 求 仍依 于 语 赖 本 身 和 言市场 规 模
( B r ac k
e n,2 0 1 1 。)考虑到上 因如 ,在某素程度种上 电,
脑
在 未来可以 很地好 助人辅翻 译工,尽 管前在或期 期编后
过辑 程仍中要有需少量或无工介人入 。
五 、结语
本 文 介绍了 脑在 辅 电人 工 翻译助方 面 的 功 ,能并 做
了 一些 文 回顾 献 和讨 ,论以 明 确 双方 如 何 互 相作 用事。
上实 尽管 电,在脑某些 特领域定己 可 以经 代人替工很 大做一
部分 的 翻 译工 作例, 如 一 些技 术 的性或简 单 的无 创造 性
的 文章 但 , 范畴其 仍 是 然受限 的 ,特 别在 是 些语一言 方
—面 —电 脑 “ 某 种对 语言 的 翻 译质 量 要 明 显 高 于 其 他 语
~ ~~ 一 ~一 . 一 ~ ~ 一 一 一 一 一一一 一 一 一 ~ ~. 一 一 一 ~~
性。此外 机翻, 现 的状是前在期编 辑,至甚是后期编 辑
过 中仍 然程需 要人 工 的介 入 。 从 另 外 一个角 度 讲 电脑,翻 译
言 ”( rBa c ke n ,2 0 11 ),这现种表像明机发展翻 的平不衡
的文本 可 看作以是 “ 稿 草而”人工 进行的后 期辑则可编 以
作是看“ 对校 ,这个前文”提 及 “的电脑 输出较 对”味 意在着追 高求量质 译 的同翻 时,人 们工的量作将大 大少减 。
尽 管有人 认 为由于 完 在 并 完成善 “ 稿草 ” 的过 程中 ,人 工 的大 量 投 入 看, 起来 们 是 辅人助 电 脑而 不是 接受 帮 的助 一 ,方然 而 恰恰相 反 。 人 们在 完 善 机 系翻统 的 同时 提, 高了
翻其译的 质 量这 恰,恰助 有提高人于们 以后的翻 译量质。 样这一来 ,实现 需大量人无 力大笔物 和投入力 的高量翻 质译 蓝图 的能性将 可高提。 此 ,因电 与脑人是互 惠类合 作关 系 。把Br a c k e n 的话作为 本 的结文再适尾合不 :过“ 除却所 有 进 步之的 ,在外 流翻译主中 , 器机在 代替人工的路 有还
很长 一 段 走 要, 但 是事 实也证 了机明翻 的 自身 价 ,值即 所 的有 言 服 务 语提供 商 机 对器 翻 译态的 度 都是 承认 其 可 性 行
非而 斥排。 ” (B r a c k ne ,20 1 1 )
(董妍
澳
大利亚考瑞麦 大学文人科学院学 )