英语论文网

留学生硕士论文 英国论文 日语论文 澳洲论文 Turnitin剽窃检测 英语论文发表 留学中国 欧美文学特区 论文寄售中心 论文翻译中心 我要定制

Bussiness ManagementMBAstrategyHuman ResourceMarketingHospitalityE-commerceInternational Tradingproject managementmedia managementLogisticsFinanceAccountingadvertisingLawBusiness LawEducationEconomicsBusiness Reportbusiness planresearch proposal

英语论文题目英语教学英语论文商务英语英语论文格式商务英语翻译广告英语商务英语商务英语教学英语翻译论文英美文学英语语言学文化交流中西方文化差异英语论文范文英语论文开题报告初中英语教学英语论文文献综述英语论文参考文献

ResumeRecommendation LetterMotivation LetterPSapplication letterMBA essayBusiness Letteradmission letter Offer letter

澳大利亚论文英国论文加拿大论文芬兰论文瑞典论文澳洲论文新西兰论文法国论文香港论文挪威论文美国论文泰国论文马来西亚论文台湾论文新加坡论文荷兰论文南非论文西班牙论文爱尔兰论文

小学英语教学初中英语教学英语语法高中英语教学大学英语教学听力口语英语阅读英语词汇学英语素质教育英语教育毕业英语教学法

英语论文开题报告英语毕业论文写作指导英语论文写作笔记handbook英语论文提纲英语论文参考文献英语论文文献综述Research Proposal代写留学论文代写留学作业代写Essay论文英语摘要英语论文任务书英语论文格式专业名词turnitin抄袭检查

temcet听力雅思考试托福考试GMATGRE职称英语理工卫生职称英语综合职称英语职称英语

经贸英语论文题目旅游英语论文题目大学英语论文题目中学英语论文题目小学英语论文题目英语文学论文题目英语教学论文题目英语语言学论文题目委婉语论文题目商务英语论文题目最新英语论文题目英语翻译论文题目英语跨文化论文题目

日本文学日本语言学商务日语日本历史日本经济怎样写日语论文日语论文写作格式日语教学日本社会文化日语开题报告日语论文选题

职称英语理工完形填空历年试题模拟试题补全短文概括大意词汇指导阅读理解例题习题卫生职称英语词汇指导完形填空概括大意历年试题阅读理解补全短文模拟试题例题习题综合职称英语完形填空历年试题模拟试题例题习题词汇指导阅读理解补全短文概括大意

商务英语翻译论文广告英语商务英语商务英语教学

无忧论文网

联系方式

日语论文润色:《基于规则的日语生成系统的组织结构》

论文作者:英语论文网论文属性:职称论文 Scholarship Papers登出时间:2011-11-26编辑:sally点击率:4454

论文字数:6929论文编号:org201111261052233728语种:中文 Chinese地区:中国价格:免费论文

关键词:人工智能机器翻译格语法汉语分析日语生成

摘要:英语论文网:日语论文范文:本文探讨了基于规则的日语生成系统的组织结构。

日语论文润色:《基于规则的日语生成系统的组织结构》

摘要: 本文介绍了一个基于转换翻译的汉日机器翻译系统中日语生成子系统的设计和实现。文章首先描述了一种基于格关系的汉语依存分析树,分析树结点记录语法语义以及格关系信息;然后,针对日语的特征,分析了日语生成中的主要问题,包括译词选择、用言活用形确定、代写日语论文助词添加等;给出基于规则的日语生成系统的组织结构,重点介绍生成规则系统的设计和实现。最后,给出规则描述的实例以及翻译实例,提出进一步改进本系统的初步想法。

 

关键词: 人工智能; 机器翻译; 格语法; 汉语分析; 日语生成

 

一、前言
汉—外机器翻译技术的研究正成为国内外研究的热点。我们在多年的日—汉机器翻译系统研究与开发的基础上,本文试探性地对汉日机器翻译技术进行一些探讨,介绍在汉日机器翻译系统中对日语生成技术的研究与开发。
目前的机器翻译方法通常有基于规则的树构造转换法和基于语料库的统计方法等[1,2,7]。本文采用的是传统的基于树构造转换的方法。它主要有两个步骤:对源语言进行分析,得到基于格关系的含有语法语义信息的树形中间结果,生成过程将它转换成一个等价的面向目标语的深层结构表示,再把它转换成目标语的表层结构,从而得到目标语。
日语生成在日本已有一些研究,IBM日本研究院Taijiro等[10]曾经对一些技术手册进行英语到日语的翻译,日语生成采用的是基于转换方法。Sumumu等[11]则提出了实例转换和规则相结合的日语生成方法。日本大学的Hajime等[12]提出基于IPAL的日语生成技术。而Taro等[13]则利用基于纯统计的机器翻译方法,根据给定的源语言,计算出最大可能的日语输出。
本文介绍一种基于汉语依存关系树的日语生成系统。文章首先介绍所基于的汉语分析算法和分析结果树;然后简单介绍日语语法,总结日语生成过程中的一些主要问题,最后,介绍日语生成系统的设计和实现。

 

二、基于格语法的汉语分析树
在基于转换的机器翻译中,译文的生成依赖于源语言分析器所产生的分析结果。本文所描述的日语生成过程基于汉语分析所产生的分析结果,我们首先介绍所基于的汉语分析。
我们在处理汉语过程中,针对汉语表达具有的层次性[8],从词汇—语义驱动出发,建立一个语言层次模型,对句子提供完整的描述。句法分析以动词为中心,采用动词的格框架以及其它一些语法语义信息(如时间、地点等),给出句子其它成分与动词之间的格关系[3],最终生成以主动词为根、基于格关系表示的依存关系树。图1给出了汉语句子“我给他打过电话”经过汉语分析后产生的分析结果。
在如图1的汉语分析树中,树结点采用了多值标记函数[4],树上的一个结点对应若干个标记,这使得树形图上的每个结点都能记录足够多的语法语义信息和格关系信息,而树的根结点,还包含了句子的时体态信息。我们共定义了35个可能的结点属性标记,例如:C—DCS(汉语词条的深层格信息)、C—TEN(汉语词条的时态信息)、C—AUX(助动词信息)、C—CAT(汉语词条分类信息)等等共34个(详见表1)。每个结点负载着多个可能的属性值,这些属性值给出了结点的格信息、时体态信息以及其它语法语义信息。例如:图1树结点“打”包含了C—CAT(词性)、C—SCT(词性细分类)、C—MOD(语态)、C—TIM(时态)等十个标记及其属性值。
单句中的格关系主要反映在分析树中的C—DCS标记上,其标记值有AGT(施事格)、LOC(场所格)、SOU(起源格)、OBJ(受事格)等等,我们根据汉语自身的特点,分为9大类,共35种格关系(详见表2)。比如图1中,“他”结点上的C—DCS=GOL表示目标格。
复句格关系描述了复句中单句的结合关系,给出了包括先行格(ANT)、后继格(SUC)、递进格(PRO)、转折格(BUT)、原因格(CAU)、结果格(RES)、推断格(INF)、条件格(CND)在内的共14种单句间的格关系。这个分析结果树包含了汉语句子所要表达的绝大部分信息,同时这个分析结果树的表达形式非常有利于目标语(日语)的生成。
为了设计出具有针对性的目标语生成系统,我们对日语的语法以及日语生成中存在的主要问题进行介绍。

 

三、日语生成中的主要问题
3.1 日语的特点
语言的形态来看,日语属于粘着语,它主要具有以下一些特点[6]:
1. 日语依靠助词或者助动词(粘着成分)来表示每个单词在句中的语法功能。
2. 日语的动词、形容词、形容动词和助动词有词尾变化(称为活用),变化形式由时体态以及粘着成分来决定。
3. 日语的主语和主题一般在句首,谓语在句尾,而修饰语(类似于汉语定语或状语等成分)则在被修饰语之前。日语句子修饰成分多数没有严格的次序,可以灵活放置。
日语是语义主导型语言,句节的语法功能和语义性质由其内部所带的格助词刻画。日语是以动词为中心的语言,其表层格与格语法[5]中的生成格有较好的对应关系。
3.2 日语生成的问题及策略
针对机器翻译目标语生成,以及日语这一特定目标语的一些特征,我们归纳出在日语生成过程中主要有下面几个需解决的问题:译词选择、粘着成分的添加、用言活用的表层生成、次序调整及日语句子表层生成。
1.译词选择
译词的选择对译文的生成质量至关重要,从语言学的角度看,译词选择是由语义、搭配关系和上下文信息决定的。对于动词而言,动词译词的选择常常要根据词语的搭配关系来实现,如汉语的“打”,翻译成日语有好几种可能的译词,“打人”中的“打”译成“殴る”,“打电话”中的“打”译成“る”,“打球”中的“打”译成“やる”等,并且如果句子是使役态,则“る”应加“られる”,而“殴る”和“殴る”应加“れる”。
对于名词译词的选择,日语同一个名词有不同语义,同一个名词也可以用不同的形容词,形容动词以及句子修饰。这往往也要根据搭配关系来选择译词。译词选择属于词的个性范围,没有统一且结构化的手段,需要不断总结语义知识,充分利用语法语义知识,寻求决定词义的语境特征结构,进而总结归纳出这些特征。
2. 助词/助动词(粘着成分)的添加
日语是一种粘着语,主要依靠助词和助动词的粘着来表示每个单词在句子中的地位和语法职能。因此,助词和助动词在日语语法中占有相当重要的地位。它们的生成也是我们日语生成中重要的一步。
助词从性质上分可以分为:附属于体言之后的助词、附属于用言之后的助词、附属于其它词后面的助词以及附在句尾表示感叹的助词。从意义关系上分可以分为格助词、接续助词、并列助词、副助词以及提示助词。通常情况下,助词的添加可以根据分析树结点的深层格信息以及相关结点信息来进行。例如:对于表示场所格的结点,其添加的格助词可以是に、で和を,这时可根据动词结点信息来决定是に(存在)、で(活动)还是を(移动)。
从功能上讲,不同的助动词给动词赋予时间的过去和未来、可能、敬谦、被动、使役、肯定、否定、希望等意义。在添加助动词时,可以根据动词结点信息(如:时体态)生成助动词。
附属词本身没有词汇意义,只有语法意义,因此它的生成需要我们对附属词的类型用法进行归纳,然后依据中间结果树每个结点上的一些格信息、时体态和语义信息在适当的位置生成适当的附属词。
3. 用言的活用形选择
日语中的用言包括动词、形容词、形容动词。用言用来表示事物的动作、存在、性质、状态等属性。用言有词尾变换(活用),可以分为七种:未然形、连用形、终止形、连体形、假定形、命令形、推量形。用言的活用形与其后续词(主要是助动词、助词等)及句子时体态相关,具有一定的规律。我们以动词为例来说明用言的活用形选择。
日语动词从词尾的形态和变化规律来看,可以归纳为四类:五段活用动词、一段活用动词(上一段和下一段)、サ变活用动词、カ变活用动词。在具体的活用处理中,我们首先确定动词的具体类属信息,一般情况我们可以根据动词的词尾确定动词的类属,对于不能根据词尾确定的动词,可通过一个特殊动词类属表以确定一些特殊动词的类属。确定动词的类属后,根据动词后续的附属成分以及分析树上句子的时体态信息决定动词的活用形,从而对论文英语论文网提供整理,提供论文代写英语论文代写代写论文代写英语论文代写留学生论文代写英文论文留学生论文代写相关核心关键词搜索。

共 1/2 页首页上一页12下一页尾页

英国英国 澳大利亚澳大利亚 美国美国 加拿大加拿大 新西兰新西兰 新加坡新加坡 香港香港 日本日本 韩国韩国 法国法国 德国德国 爱尔兰爱尔兰 瑞士瑞士 荷兰荷兰 俄罗斯俄罗斯 西班牙西班牙 马来西亚马来西亚 南非南非