c(联系动词),Vr(代动词),Vu(摹拟动词)2)及物、不及物字段标记:VTVSHV值标记:1(及物),2(不及物),3(及物、不及物双重性)3)积极、消极字段标记:VIDEBHI值标记:1(积极),2(消极)3.确定的动词语法属性字段确定的语法属性字段有35项,因篇幅所限只列出5项。(1)动词子类(VSUBC)填动词子类标记。如: SAGV(Vg) ING-GI(Vr) ANI BALJA(Vu) GE(Vc)(2)及物、不及物(VTVSHV)•48•填及物、不及物值标记。如:SVR(1) UHU(2) AYIMAGLA(3)(3)极、消极(VIDEBHI)填积极、消极值标记。如:GUYU(1) SITA(2)(4)无异形词(0ND00)如有填异形词,否则不填。如:AMARA(AMV)
三、动词语法属性字段的作用如上所述动词语法属性字段是《蒙古语语法信息词典》的重要组成部分,它在蒙古语自动分析和生成、机器翻译、自动校对等各种信息处理系统中被运用,并起到重要作用。
1.在蒙古语自动分析中所起的作用在蒙-外机器翻译等自然语言处理系统中蒙古语分析是首先进行的重要步骤。蒙古语是黏着型语言,其构词、构形都是通过在词干上缀接词缀来实现。我们已建立一部动词词典,而且把词干所表示的语法信息标注在词典上,现在假设已建立词缀库,可用一个有限状态转移网络来描述词法分析的过程,实现对蒙古语的词法分析。例如,我们可以建立如下图的有限状态转移网络来分析蒙古语词“ABVGVL/V/GSAN”。(Bq0)———(Bq1)———(Bq2)———(Bqf)q0为初始状态, qf为终极状态。我们可从动词库以及词缀库获取以下信息:AB:动词词干,有使动态“GVL”和形动词的变化;GVL:使动态的一种形式;GSAN:形动词过去时形式。在对上图中的有限状态转移网络进行遍历时,词典中的信息被记录到“ABVGVL/V/GSAN”上,可知这个词是由动词词干“AB”加上使动态形式“GVL”,再加上形动词过去时形式“GSAN”黏着而成,其含义是“让拿了”。
2.在蒙古语自动生成中所起的作用蒙古语动词语法属性描述对外-蒙机器翻译中正确生成蒙古语句子起到了极其重要的作用。汉-蒙机器翻译为例,它由汉语分析部分、蒙古语生成部分、翻译部分以及使用界面等四个部分组成。其中语法属性字段对蒙古语生成规则及汉语到蒙古语的转换规则集中起到很重要的作用。生成规则及转换规则集都从蒙古语言模型中获取所需语法知识,即生成规则中体、态、时间、陈述式的各种形式均以规则来确定;转换规则中一个具体的规则根据它的需要,不同程度地运用了语言知识。汉-蒙机器翻译的研制工作虽然在“蒙古语语法信息词典”还未完全研制前已开始进行,但当时从蒙古语自身特点着手,再根据机器翻译的各种需求,首先抓住了蒙古语生成所需的信息,因此蒙古语生成工作在一定程度上已得到解决。我们现在研制的动词词典也是以这些信息为基础,加大信息量,使信息更加精确化。这样精确化的作用何在?我们以一个语法属性字段为例,“态的重叠”这一字段给我们提供一个词有无态的重叠,如果有,是哪些态的重叠等信息。如计算机遇到蒙古语的“BEYELE”,可获有“GVL+GDA,GVL+CAG-A,GDA+GVL”等态的重叠形式的信息,通过此信息可生成“BEYELE/GUL/U/GDE/HU, BEYELE/GUL/JEGE/HU, BEYELE/GDE/GUL/HU”等准确的形式。3.在蒙古语自动校对中所起的作用在今天的信息时代计算机已普及到千家万户,成为人们日常生活中密不可分的一部分。具有自动校对功能,能够及时纠正错误的word文字处理系统给广大用户提供了极大的方便。蒙古语书版系统自产生之日起到今天的广泛运用,用户不断要求通过自动校对系统来提高工作效率。20世纪80年代内蒙古大学蒙古语文研究所研制过一个基于拉丁文转写的蒙古语语料校对系统。该系统通过一个较为简单的电子词表和生成规则提示文本中四种不同类型的错误。但受词表规模所限,在词表中未登录词,虽然其本身是正确的,还要报错。如:“UHU/SHI, TVYAGARA/LDV,HUITERE/JEGE”这类错误无法用该系统判断。因为这些语言现象没有什么规律可循,所以也无法用一种语法规则来断定。如果我们研制出基于语法信息词典的自动校对系统,这类错误很容易被发现。词典中分别注明“UHU,TVYAGARA,HUITERE”三个词没有短暂体变化、没有互动态变化、没有众动态变化。与此同时对每个词有哪些态和体的变化,都有一一注明。这样不仅可以报错,而且可自动修改,不能自动修改的,可提供候选词。
4.研制输入法时所起的作用已开发的蒙古文输入法有字音输入、字形输入、字音选择输入、字音和内码混合输入、整词输入法等。今后还需研制扫描输入、语音输入等新的输入法以及不断地提高现行输入法的智能化程度。在此过程中语法信息词典的作用是不可一屑的。我们现行的键盘输入法,因为手误,常常遇到缺牙或多牙的情形。如“HARIYALA/GVL/JV”一词,因为手误,输入成“HARIYAL/GVL/JV”,缺个牙。计算机识别到“GVL”是动词使动态,“JV”是并列副动词形式后,可断定该词的词干应该是动词。而“HARIYAL”是名词,从而计算机能够识别输入的词是错误的。如果能够进一步获取推断动词“HARIYALA”的信息,则能够达到输入正确的“HARIYALA/GVL/JV”一词的目的。在我们的动词库里有动词词干“HARIYALA”,而且已注明有使动态“GVL”的变化。所以计算机能够获取正确输入“HARIYALA/GVL/JV”的信息。计算机智能化程度提高,输入速度也随之加快,出错率反而会下降。
参考文献:
[1]内蒙古大学蒙古语文研究所.蒙汉词典[Z].呼和浩特:内蒙古大学出版社,1999.
[2]内蒙古自治区计算中心,内蒙古社会科学院蒙古语言文字研究所,内蒙古蒙古语文工作委员会学术处.现代蒙古语词频词典[Z].呼和浩特:内蒙古教育出版社,1998.[
3]清格尔泰.蒙古语语法[M].呼和浩特:内蒙古人民出版社,1999.
[4]俞士汶等.现代汉语语法信息词典详解[M].北京:清华大学出版社,1998.
[5]冯志伟.自然语言的计算机处理[M].上海:上海外语教育出版社,1996
.[6]黄昌宁,张谱.自然语言理解与机器翻译[M].北京:清华大学出版社,2001.
[7]徐尔贵,余晓红.面向对象数据库教程[M].北京:电子工业出版社,2000.
[8]李晋有.中国少数民族语言文字现代化文集[C].北京:民族出版社,1999.
[9]那顺乌日图.蒙古语语法信息词典框架设计[D].内蒙古大学蒙古语研究所博士学位论文,2000
.[10]日本電子化詞研究所.EDR電子化詞[M].1990.
V•50•附:“蒙古语语法信息词典”动词库示例
附:“蒙古语语法信息词典”动词库示例
№monggol galig ugsaimag vsubc vtvshv videbh ondoo tvsala gvl lg_a g_a gda ldv lca cag_a
1 AYIMAGLA V Vg 3 1 No Yes No No GDA No No Yes
2 AB V Vg 1 1 Yes Yes No No DA Yes Yes Yes
3 AMARA V Vg 2 1 AMV No Yes No Yes No No Yes
4 AMTARH_A V Vg 2 1 No No No No No No Yes
5 EHILE V Vg 1 1 Yes Yes No No No No Yes
6 EMCILE V Vg 3 1 No Yes No No No No Yes
7 EMJIYERILE V Vg 1 1 No Yes No No GDA No No Yes
8 INGGI V Vr 1 1 No Yes No No No No Yes
9 IDE V Vg 1 1 No Yes No No GDA No Yes Yes
10 IR_E V Vg 2 1 Yes Yes No No No Yes Yes
本论文由英语论文网提供整理,提供论文代写,英语论文代写,代写论文,代写英语论文,代写留学生论文,代写英文论文,留学生论文代写相关核心关键词搜索。