• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 学前教育 > 正文

    英汉机器翻译中的歧义及消歧方法 歧义句大全及答案

    时间:2019-02-07 03:29:04 来源:雅意学习网 本文已影响 雅意学习网手机站

      摘 要: 排除语言歧义是机器翻译中最难的难题,如果语言歧义不能排除,机器翻译的译文质量就不会有质的提高。本文从词汇歧义和句法歧义两方面对英语语言中的歧义现象进行分析,阐明其形成过程,探析其形成原因,并提出英汉机器翻译的一些消歧方法,以提高机器翻译的译文质量。
      关键词: 机器翻译 词汇歧义 句法歧义 消歧方法
      
      一、引言
      机器翻译(MT)指的是通过计算机系统将源语翻译成目的语的一种翻译方法。语言歧义的排除是机器翻译的难题,歧义现象是自然语言的普遍现象,歧义的处理是提高译文质量的关键。要提高排除语言歧义的效率就必须在深入研究语义变化一般规律的同时,研究每个多义词词义变化的特殊规律,选择何种排歧方法要因词而异,这样才能提高排歧效率。
      二、英语歧义现象
      一种语言形式能够传递两种或两种以上的意义,可以作两种或两种以上的解释,这就是歧义(ambiguity)。一词多义是自然语言中存在的普遍现象,英语中的名词、代词、动词、形容词、连接词、介词等都存在歧义。
      例1:Tom is a bachelor.
      句中名词“bachelor”既可以表示“单身汉”(an unmarried man),又可以表示“学士”(a first university degree),准确的含义要根据上下文或语境来确定。又如:
      例2:I ate a fish with a fork. (我用叉子吃鱼。)
      例3:I ate a fish with bones. (我吃带刺的鱼。)
      三、英语歧义形成的分析
      (一)词汇歧义形成的分析
      词义存在着三个层次:系统词义(概念词义)、情景词义和联想词义。系统词义是词义的第一个层次,它是一种抽象的词义,主要是指一类事物的基本特征;情景词义是词义的第二个层次,它是词的具体所指,属语言使用中的词义(当然,具有情景词义的词主要是实词,功能词没有这种性质)。联想词义属词义的第三个层次,它附属于概念词义,呈隐性,埋伏较深,容易被忽略。
      词义不是单一的,而是错综复杂的。在交际中,交际双方有时虽然都使用同一个词,但由于各自理解该词的词义层次不同,便会产生歧义。词义的特征之一是它具有民族特点的语言范畴。不同的民族对同一个词产生的联想词义不一定相同,这也常常造成歧义。例如,“龙”字,在汉语中有很重的文化意义。龙是中华民族的象征,它代表一种气势磅礴的民族精神,从古至今,龙所引起的联想都是正面意义,中华民族也被称作“龙的传人”。然而在西方,“dragon”的文化意义是“怪物、魔鬼、凶残”等,是罪恶的象征,两种联想意义大相径庭。
      通过以上分析我们可以发现,由于词义的多层次性,在交际过程中,如果交际双方对同一个词汇的意义作不同层次的理解,便有可能产生歧解。因此,词义的多层次性是产生词汇歧义的主要原因之一。
      2.句法歧义形成的分析
      句子意义纷繁复杂,头绪众多。一句话有句法层次结构,也有语义层次结构。句子意义的分析有两种层次框架:第一种是与句法结构相对应的语义层次框架(结构框架),第二种是语符与语义之间关系的框架(符义框架)。
      如果一个句子的结构从语法上可作两种或两种以上划分,每一种划分便分别对应着一种意义,句子便由此产生歧义。
      例4:They kidnapped the old coin collector.
      这个句子所以引起歧义,是因为其中的形容词辖域(focus scope)不确定。例句中的形容词old既可以修饰名词coin,又可以修饰coin和collector两个名词组成的组合体,从而使句子产生两种句义:①他们绑架了那位古币收藏家;②他们绑架了那位年迈的硬币收藏家。
      句法歧义的产生有时正是因为句子在同一个表层结构下,有两个或两个以上的深层结构,由此引出两个或两个以上的句子意义。
      例5:The refugees had discarded clothes.
      歧义的产生源于短语had discarded有两种语法关系,即两种语义解释为:①难民们有了(被别人)抛弃的衣服;②难民们把衣服都抛弃了。
      由于“句法不仅包括已经说出来的话,还包括对于已经说出来的话还说了什么或暗示什么”,因此,一个句子除了其词汇、语法意义外,有时还蕴含了发话者暗含的意义。读者或受话者若听话不听音,错误理解其中的蕴含意义,便会产生歧义。
      实际上,结构框架和符义框架是相互联系和影响的,两者的交汇点是句子的总体直接句义。
      四、英语歧义的消除
      (一)词义消歧方法
      1.选择最常见涵义
      这个方法的消歧效率非常低,但由于它简单易行,而目前又没有其他非常有效的方法可用,因此大多数翻译系统采用这一方法。
      2.利用词类进行词义消歧
      比如,在句子“We can what he can eat.”中的第一个“can”应该为动词,所以可以确定其涵义为“把……装罐”。但是当两个义项属于同一个词类时,这种方法就无法消歧。例如,对于“The man is rather old.”一句中的“old”这种方法就不能确定到底该译为“这个人很旧了”还是应该译为“这个人很老了”,因为“旧”和“老”两个义项同属于形容词。不过这种方法能够有效地缩小词义选择范围,所以可以配合其他消歧方法一起使用。
      3.基于选择限制词义消歧
      上例中“old”表示“老”时,要求主语是生物,而表示“旧”则要求主语为非生物。国内外对于这种消歧方法研究得比较深入,比如普林斯顿大学认知科学实验室开发的词网(Word-Net)软件,国内中科院董振东先生建立了知网(How-Net),等等。这些研究成果都为基于选择限制词义消歧做出了很大贡献。
      4.基于共现特征的词义消歧
      多义词的每个义项一般都与另外一些词一起出现,例如,“bank”是多义词,在“The flood destroyed the river bank.” 一句中出现的“flood”和“river”一般与“bank”的“堤”义项一起出现,所以“flood”和“river”可以帮助消歧。
      5.无指导的词义消歧
      这种方法先通过对大量的语料进行计算统计,得出任意两个词的共现频率,然后对共现频率比较高的任意两个词进行计算统计,筛选出大于一定共现频率的数据,形成共现频率表。
      6.基于词典的词义消歧
      这种方法首先计算上下文中相邻词定义间的相似度,然后选择定义相似度较高的义项。例如在“I ate a fish with a fork.”一句中“with”是个多义词。如果在计算机可读词典中“fork”定义为:“an instrument for eating food”并且“with”定义为①instrument;②part of ...两个词的定义中都出现了“instrument”那么这句中的“with”就应该取“instrument”的涵义,而不应该取“part of”的涵义。这种方法的主要缺点是计算机可读词典中的每个词的定义通常太短,无法为词义消歧提供足够的信息资源(冯志伟,2004:594)。
      (二)消歧应因词而异
      在研究过程中发现,根据多义词的情况不同,适用的消歧方法也不同。比如,区分“old”的两个义项“老”和“旧”时,基于选择限制的词义消歧特别有效。这里基于共现特征的词义消歧则不适用,因为属于人类和非人类的词太多。而另一种情况下基于选择限制的词义消歧则可能完全派不上用场,例如“bank”的第17个义项“封(炉,火)”要求“bank”做及物动词,并且宾语为“炉”或者“火”,选择限制利用词的具体分类不可能具体到包括“炉、火类”的程度。在这种情况下,基于共现特征的词义消歧方法却十分有效,只要给出“fire”,“flame”,“furnace”等共现词,并要求这些共现词出现的结构中与“bank”发生密切关系,就可以判定在该语境中使用的是这一义项。基于共现特征的词义消歧由于不能因词而异,因而经常导致失败。在基于共现特征的词义消歧时,要具体规定共现词出现在什么位置、什么结构中,如果不规定而根据窗口大小判定,很可能导致语义消歧的失败。上面例子对于“封(火)”这一义项可以这样判定:如果“bank”做及物动词且后面宾语为“fire”,“flame”,“furnace”等,或者当“fire”,“flame”,“furnace”等为主语且后面出现“be+banked”谓语时,“bank”表示“封(火)”。另外,该方法只注意到共现词,没注意到其他共现特征。比如“bank”的最常见涵义“银行”,使用这一义项时,上下文并不一定出现“money”,“account”等共现词,也不能用基于选择限制的方法,但是有一个非常明显的却没被发现有消歧方法考虑到的特征:“bank”往往首字母大写,而且常出现于“Bank of”,后面再跟上首字母大写的另一个单词;还有一种情况是“bank”首字母大写,前一个词也是首字母大写。这一特征与“银行”这一义项有极密切的共现关系,而字母的大小写往往在语义消歧中被忽略了。
      由此可见,常用的消歧方法过于追求词义变化规律的普遍性和消歧方法的通用性,而忽略了多义词词义变化是没有普遍规律可言的事实,所以不能最终解决语义消歧的难题。
      五、结语
      语义消歧是机器翻译中最困难的问题,也是决定译文质量的关键问题。因为每个多义词的词义变化规律都各不相同,所以在研究语义消歧的过程中没有什么捷径可求,只能因词而异,一个词一个词地去研究。这任务虽然看似在编写一部双语词典,事实上要比编写一部双语词典难几十倍,因为每个多义词的消歧都需要耗费研究者大量的时间和精力。不过,如果能解决作为当代科技十大难题之一的机器翻译问题,意义将是非常深远的,这方面的商业价值也不可估量。
      
      参考文献:
      [1]冯志伟.机器翻译研究[M].北京:中国对外翻译出版公司,2004.
      [2]王扬.略论语境与词义的理解[J].国外外语教学,1999.
      [3]廖定中,蒋澄生.英语句法歧义简议[J].四川外语学院,1998.
      [4]史晓亮.英汉机器翻译中语言陷阱的自动检索标识方法[J].科技信息,2011.
      [5]鲁孝贤.机器翻译语义排歧的方法[J].中国科技翻译,2007.

    推荐访问:机器翻译 歧义 英汉 方法

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章