让电脑给人当翻译
文/许寿椿 赵富芬
人类的一个美好理想
工业时代开始的早期,就有人幻想让机器当语言翻译。最初还没有设想得那么美好,先设想编一种机器字典。到本世纪初,有几位科学家进一步提出这种设想,还有人申请了相关专利。但在工业时代,以机械化为主要技术手段的情况下,这只能是美好的幻想。待到电子计算机诞生,终于给实现这种理想创造了条件。电子计算机诞生的五十多年,让计算机充当语言翻译(习惯上称为机器翻译)的工作走过了草稿、低落、复苏、发展的几个阶段。近年来,因特网的广泛普及又给机器翻译以新的刺激与推动。
电脑网络发展催促人们加紧实现这一理想
为了理解网络时代翻译的迫切需求,我们先回顾一下古代的翻译。著名翻译家玄*",27岁时(公元629年)出发赴天竺取经,途中历经无数艰险磨难,历17载返回长安。又潜心翻译18载,译出经、论75卷。唐僧的时代,交通不便,交流不易,获取要翻译的信息异常艰难。但今日,世界上亿万台电脑已联成网络,人类历史积累的大量宝贵遗产迅速地转化为可供快速查询的电脑版本。世界上大约有十万种科技期刊每年产生上千万篇的文献,同时大量的政治、经济信息也都迅速存入电脑。今日中国,无论是大城市还是县城、小镇,只要你有一部电话,一台电脑,再加少量附件,你就可以在自己电脑旁,足不出记地获取比天竺遥远得多的各地的信息。获取的速度是每分种许多万字。十余分钟内获得的资料,可能足够你经年累月的苦译了。在你潜心苦译时,极有可能资料已大大更新,或失效了……。电脑网络上的资料十分丰富,可惜绝大部分是英文的,而世界上以英语为母语的人数并不太多。截止1997年,英、美、澳大利亚、新西兰四国的因特网用户仍占总用户的68%强。全世界全部非英语用户不足三分之一。这从一个侧面反映出语言障碍之严重。实际上,现今任何国家、民族或语言集团,都没有能力靠人工适时地把网上信息译成本地语文,在这个突出矛盾面前,让电脑当翻译的理想变成人们追求的目标。
规模巨大的机器翻译项目——UNL工程
近些年来,人们纷纷研究开发在网络环境下使用的机器翻译软件,其中,规模最大的当属UNL工程。这是1995年12月经联合国常务理事会通过,并于1996年开始实施的国际性协作项目。项目实质是开发一个机器翻译软件。UNL是英语通用网络语言(Univtrsal Networking Language)的缩写。项目第一阶段解决英、法、汉、阿、俄、西(班牙)六种语言互译,第二阶段解决联合国成员国185种语言互译问题。如果采取简单的孤立的方式,六种语言的两两互译,要开发6×5/2=15个互译软件;而185种语言的两两互译要开发17020个互译软件。UNL工程规定,每种语言只建立与UNL的互译,不同的两种语言互译都通过UNL完成。例如,要完成汉——英,可以通过汉——UNL——英完成。这可以用电话的中转来解释,你常和十个朋友电话联络。你和你每个朋友间并不需直接连电话线,只要你和你的朋友都把电话接入电话局就可以了。UNL就是实现翻译的中介语言。这个中介语是精心设计的,它要适用各种民族语言语义表达的准确性和通用性,避免各民族语言的词汇岐义结构岐义。各国家或语言集团负责建立本地语言与UNL转换。
半个世纪的风雨历程
尽管机器翻译的理想可以追溯较早,但实际的起步还是在电子计算机诞生之后。至今大约只有半个世纪的历史。第一台计算机一诞生,就有许多学者纷纷提出用它进行语言翻译的设想。五十年代,美、俄、英、中、日、先后完成了各自的第一次例句翻译实验,到六十年代中这一阶段,构成机器翻译的草创期。这个时期人们对机器翻译期望过高,对困难估计不足,所采取的方法主要是词汇对译的方法。
1964年美国组织专家对机器翻译问题进行调查。1966年写出了著名的ALPAC报告。这个报告对当时已有成果评价很低,对发展前景估计悲观。在这个报告的影响下,许多机构纷纷消减经费,机器翻译陷入低潮,在中国,十年浩劫也使相关研究完全停顿。
七十年代中期,自然语言机译工作重新复苏。个别在低潮期坚持研究的机构推出了若干有实用价值的产品。八十年代以来,计算机软硬件技术给机译提供了空前强大的基础,机译事业开始了新的发展时期。
机器翻译及其一般的计算机人工智能技术,无论是高潮期还是低落期,都没有停止过被诘难的命运。这大概是它挑战人类智能不可避免的遭遇吧。
人工语言的机器翻译已经取得巨大成功
机器翻译的最初目标,或主要目标是解决像英语、汉语这种自然语言的翻译问题。在其研究过程中形成的形式语言学,利用数学形式化方法研究各种现实的和可能的语言,并把语言从简单到复杂分为四类:正则语言、上下文无关语言、上下文相关语言、一般语言。英语、汉语这种自然语言,其复杂性至少是上下文相关的。
上下文相关曾经给计算机翻译带来巨大困难,因为计算机毕竟是机器,它只能按规则运行。而自然语言的上下文相关是很难用规则描述的。上下文相关不限于相邻近句子之间的关系,可能是相距其远间语句的关系,甚至是文外的常识在起作用。人在理解一句话时实际是利用了自己全部知识,包括常识。这些东西很难用具体规则说清楚。要说清楚,就需要有一个异常庞大、无所不包的知识库。除了这种常识问题外,典故、比喻、影射这些修辞方法都给机器翻译带来巨大困难。实际上,这些也困扰着人类翻译家。有资料介绍,毛泽东在接待美国客人时曾说:“我是和尚打伞,无发(法)无天”。这句话弄得中美双方译员都一头大汗,怎么也没有译准确。
一些人文学者为什么诘难、攻击机器翻译
各国都有一批人文学者,撰文甚至著书诘难攻击计算机科学中的人工智能和机器翻译。说这是神化机器、技术至上、愚弄公众。说计算机专家不过是哗众取宠等等。广泛地看,这种诘难与世界各地人文与科技两种文化观念的矛盾有关。本文无法一般性评论这种论争。作者只想说明:公众对机器翻译的某些误解是造成或加深矛盾的因素。科技专家曾有过对机器翻译过份乐观的估计。但当今严肃的计算机专家都深知用电脑翻译自然语言,要达到准确、自动化是极其困难的。一个负责的技术专家,对机器翻译项目的目标都是谨慎的。
机器翻译的局限和巨大价值
准确、自动化的机器翻译确实还有漫长的路,但在今天开放、经济日益国际化、因特网日益普及的时代,机器翻译仍有巨大的价值。现今机译产品的价值不在于其万能、准确,而在于它确实有些用处。这种用处是具体的,有限制的。例如,其一,应用专业领域的限制,一个翻译软件仅适用于冶金专业、电子专业等。加拿大有一个专用于天气预报的英法互译系统,从70年代中期起便一直实用中。其二,对原语言修辞或结构方面的限制,如不允许使用典故。这种限制对科技文献来说并不过份。其三,使用目标的限制,不是以精译、精读为目的,而只是计算机帮助在大量资料中筛选、粗选少部分有价值的材料。这些有限制性的使用是有价值的。机译的优势在于其高速加工能力和极低的价格,这是帮助人们避免陷入数据汪洋中无法自拔的有力工具。它不完全理想,但却在发展中。它需要扶植和宽容。机器翻译的真正成功,有赖于计算机专家、语言学家和领域专家(机译软件的用户)的不懈合作。
