当前位置:翻译技巧

中国机器翻译的世纪回顾

来源:  作者:本站

  (1)源语言分析将是大语境的、基于理解的。如今的分析都是孤立的一个句子一个句子进行的,即单个句子为处理的基本单位。未来的分析将是以句群为单位的。如今的分析求出的是句法关系树,充其量是概念的语义关系图,而不是对文本给出的意思的求解。有人说,简单的都做不到,那么复杂的就更不可能了。其实不然,正是"简单"了,有些问题才变得无法解决的。现在认为"简单"的,几十年前,不是很复杂的吗?

  (2)加强基础研究,特别是常识性知识库的建设。有的学者提出建设知识词典,利用它进行基于理解的分析。笔者经过十多年的努力建立的大型知识系统《知网》,今年已上网供研究免费使用。它引起了海内外学者的广泛注意,并已有人在它基础上开始进行新的探索,如上面介绍的基于理解的分析以及新的排除歧义的方法。请读者浏览www.how-net.com 网页。

  (3)机译系统将出现高度专业化的趋势。这种系统是为某个特定领域进行调试的,它实际上具备较充分的专业知识,而不仅仅是只有一本专业词典而已。

  (4)基础性资源的共享,对于类似于机器翻译这样的研究来说是大趋势。如今我们可以在网上获得许多很宝贵的有关英语的、日语的资源,也有繁体中文的资源。(可惜简体中文的太少了。)因特网提供了一种知识资源共享和知识产权保护的全新的概念和方式。在近两次世界机器翻译高峰会上日本各大计算机公司都介绍了它们如何共享共建机译系统的专业词典的做法,值得我们借鉴。在当今网络时代,陈旧的知识资源保护手段到头来封杀的不是别人而是我们自己。

  (5)机器翻译系统的高度模块化将有可能带来未来的机译系统的组件化。这样机器翻译系统的研发周期有可能大大缩短。开发者可以把更多的力量放在突出自己的特色上和专门化上。   本文作者为中国中文信息学会常务理事。


   《中国计算机世界》2000第一期,2000/01/03



上一页 1 2 3下一页
相关文章
热点关注
随机推荐
栏目列表
关于本站 | 会员服务 | 隐私保护 | 法律声明 | 站点地图 | RSS订阅 | 百科
免责声明:凡本站注明来源为xx所属媒体的作品,均转载自其它媒体转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责