• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 作文范文 > 正文

    【现代汉语形容词概念语义模型及其在电子词典编纂中的应用】 现代汉语电子词典

    时间:2019-04-23 03:31:19 来源:雅意学习网 本文已影响 雅意学习网手机站

      【摘要】文章对《现代汉语规范词典》中127个高频形容词的释义项进行统计分析,研究发现常见形容词释义模型特征为“实体一特征一值”,提出将此模型应用于编撰对外汉语形容词同义词、反义词电子词典。该研究对于电子词典自动转换具有重要指导意义,并可以推广到其他语言类词典的自动转换制作。
      【关键词】现代汉语形容词;概念语义模型;电子词典编纂
      【中图分类号】G40-057 【文献标识码】A 【论文编号】1009—8097(2012)06-0062-03
      一 现代汉语形容词的常见释义方法
      在《现代汉语规范词典》中,一共收录了2,000多个形容词。参考《现代汉语语法信息词典》,从中选择了如下127个高频单音节形容词作为考察对象:
      从总体上说,《现代汉语规范词典》采用的释义体系是按意义的引申脉络安排义项,即第一个义项为本义,其余为引申义。从词源学的角度来说,本义是词的起始义项。然而,该义项并没有废弃,而是处于经常的使用之中。
      对上述127个形容词的释义项进行考察,发现一种常见的释义方式是:同义词、反义词加特征。此处,同义词和反义词也是高频形容词。而特征指的是释义项和被释义项共同的语境限制语(一般通过圆括号引入),其作用是解释两个词语在哪些方面相同或者相异。例如,“大”的一个义项为:(在面积、体积、容量、数量、年龄、力量、程度、重要性方面)超过通常的情况或特定的比较对象(跟‘小’相对)。其中,“小”是“大”的反义词,而“面积”、“体积”等是其特征。
      具体统计结果如下:
      1)在127个形容词中,有69个形容词的本义中既有同义词或反义词,也有特征;
      2)31个形容词的本义中只有同义词或反义词,而7个形容词的义项中只有特征;
      3)在20个形容词的本义中,既没有出现同义词、反义词,也没有出现特征。
      通过进一步考察,发现部分形容词的引申义中采用了同义词或反义词加特征的释义方法:或本身作为同义词或反义词在其他高频形容词的释义项中出现。二现代汉语形容词概念语义模型的建构
      在认知科学的研究中,“特征,值”结构(attribute-valuesystem,简称AVS)是一种常见的表征形容词语义的理论框架:名词概念分解为一组特征(attributes),形容词则处理为特征的值(values)。以smith的选择性修饰模型为例(如图1):
      在此图中,最上层为“苹果”这个简单概念。中间层为该概念所具有的一些特征——“颜色”、“形状”和“质感”等等。最下层为特征的值。例如,“形状”可以进一步分为“圆的”、“方的”、“圆柱形的”。
      基于AVS的理论框架,我们可以建立现代汉语形容词的概念语义模型。在图2中,形容词及其同义词和反义词都处理为特征的值。
      其中,E为实体,表征名词概念;A1、A2表征不同的特征;v2和v1、v3分别是形容词及其同义词或反义词。与以往的一些形容词概念语义模型相比(例如Blutner的联结主义选择性修饰模型),该模型的一个创新点是一个值可以与多个特征相联结,从而有效地表征了形容词本身的多义性。
      三 现代汉语形容词概念语义模型的自动抽取
      对于一个具体的形容词而言,其同义词、反义词和特征是不完全相同的。由于手工建立每个形容词的概念语义模型费时费力,有必要考虑采用自然语言处理中的技术进行自动抽取。
      目前,我们主要采用模板抽取的方法,从机读词典中自动地抽取形容词的概念语义模型。基本步骤如图3所示:
      形容词的概念特征需要从释义项中提取,因此需要对其进行预处理。本文采用了上海交大计算机系计算语言学实验室开发的切分标注系统SEGPOS,对释义项进行了分词处理。同时,进行了初步的句法分析:采用浅层句法分析的方法,从释义项中抽取名词短语、动词短语等句法成分。
      以127个高频形容词作为训练集,对一部分词条的释义进行了标注,在此基础上生成一些抽取模板。与此同时,手工从中抽取概念特征或属性,以之作为机器自动获取的样例(见表1)。
      然后,将所抽取的模板用于概念特征的自动抽取。基本思路是:主要采用定义形式自动机的方法,对人工标注完成的形容词训练集进行分析。抽取的模板被看做是由项所组成的有序序列,每个项对应于一个词或者词组。
      以模板“形容……一样”为例,可以根据它的特点概括为一个模式:
      P=prep+(noun|attr|adj.attr)+adv
      用有限自动机的方式可以表示为:
      将这个自动机转换成如下正则表达式,机器就可以进行分析并进行模板的自动抽取:
      Pattern=prep(adj|n)’adv
      实验结果表明:在进行特征抽取的时候,采用模式匹配法的准确率高达93.12%,优于词频分析法和最大公共子串分析法。
      采用同样的方法,可以开展形容词同义词和反义词的自动抽取。常见的同义词模板有“……而……”,反义词模板有“跟……相对”、“不……”等等。采用这些模板也取得了令人满意的效率。
      四 在对外汉语电子词典编纂中的应用
      1 外向型学习词典的释义结构
      从词典学的角度来看,现代汉语形容词概念语义模型可以作为一种外向型学习词典的释义结构。与传统的文本内向词典相比,它具有如下几个方面的优势:
      (1)能够清晰地区分同义词的异同,提高学生的辨义能力。两词相同,是由于联结了相同的特征和值,不同之处在于联结了其他的特征或值;
      (2)能够简便地区分词典中收录的形名组合是词组还是复合词,从而提高学生的搭配能力。如果某个实体(表征了名词)可以与不同的值(表征了形容词)相联结,形名结构一般为词组,否则很可能是复合词;
      (3)提供了词汇查询和概念查询两种途径。通过特征,可以同时查到相关的形容词和名词。学生在书面表达中需要采用形名结构的时候,可以在一组相关的同义词中挑选出合适的形容词;
      (4)通过进一步调整语义模型中的特征、值的数量以及出现次序,就能够调整教学的进度和难度,从而满足不同水平学习者的学习需求。
      2 双语学习词典的释义结构
      现代汉语形容词的概念语义模型是对英语中选择性修饰模型、联结主义选择性修饰模型等AVS语义模型的继承和发展,因此也能够反过来表征英语中的形容词概念语义。
      《牛津英汉双解实用词典》(A.s.Homby)是一本在国内外具有广泛影响力的词典。通过不完全统计分析,发现其形容词的释义方式与《现代汉语规范词典》高度相似。例如:
      big adj.1 large,n size,extentorintensity…
      red adj.2(a)of the very darkest colour,like coal 0r soot;opposite ofwhite,
      在“big"的释义中,“large”是其同义词,而“size”、“extent”和“intensi够”是其特征。而“red”的反义词为“white”,特征为“colour”。
      因此,现代汉语形容词的概念语义模型可以进行泛化,进一步表征英语形容词的释义项。从这个角度出发,可以清晰地揭示英、汉两个同义形容词在所联结的同义词、反义词和特征等方面的细微差异。
      五 结束语
      在对外汉语教学中,词典发挥了重要的作用。然而,目前所使用的一些词典大多为内向词典,主要用于本族语者的学习和工作需要。因此需要在此基础上改编为学习词典,尤其是双语学习词典,才能更好地满足外国学习者需要。随着对外汉语计算机辅助教学的发展,有必要进一步转换为相应的电子词典。
      本文所提出的现代汉语概念语义模型是一种新型的学习词典释义结构。采用模板抽取技术,能够将机读版内向词典,例如《现代汉语规范词典》自动改编为一本形容词同义词、反义词电子学习词典。
      由于该模型也能够有效地表征英语形容词的释义项,可以进一步用于英语词典的自动转换,从而在此基础上编纂出一部双语形容词同义词、反义词电子学习词典。
      编辑:李原

    推荐访问:语义 编纂 现代汉语 形容词

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章