英语论文网

留学生硕士论文 英国论文 日语论文 澳洲论文 Turnitin剽窃检测 英语论文发表 留学中国 欧美文学特区 论文寄售中心 论文翻译中心 我要定制

Bussiness ManagementMBAstrategyHuman ResourceMarketingHospitalityE-commerceInternational Tradingproject managementmedia managementLogisticsFinanceAccountingadvertisingLawBusiness LawEducationEconomicsBusiness Reportbusiness planresearch proposal

英语论文题目英语教学英语论文商务英语英语论文格式商务英语翻译广告英语商务英语商务英语教学英语翻译论文英美文学英语语言学文化交流中西方文化差异英语论文范文英语论文开题报告初中英语教学英语论文文献综述英语论文参考文献

ResumeRecommendation LetterMotivation LetterPSapplication letterMBA essayBusiness Letteradmission letter Offer letter

澳大利亚论文英国论文加拿大论文芬兰论文瑞典论文澳洲论文新西兰论文法国论文香港论文挪威论文美国论文泰国论文马来西亚论文台湾论文新加坡论文荷兰论文南非论文西班牙论文爱尔兰论文

小学英语教学初中英语教学英语语法高中英语教学大学英语教学听力口语英语阅读英语词汇学英语素质教育英语教育毕业英语教学法

英语论文开题报告英语毕业论文写作指导英语论文写作笔记handbook英语论文提纲英语论文参考文献英语论文文献综述Research Proposal代写留学论文代写留学作业代写Essay论文英语摘要英语论文任务书英语论文格式专业名词turnitin抄袭检查

temcet听力雅思考试托福考试GMATGRE职称英语理工卫生职称英语综合职称英语职称英语

经贸英语论文题目旅游英语论文题目大学英语论文题目中学英语论文题目小学英语论文题目英语文学论文题目英语教学论文题目英语语言学论文题目委婉语论文题目商务英语论文题目最新英语论文题目英语翻译论文题目英语跨文化论文题目

日本文学日本语言学商务日语日本历史日本经济怎样写日语论文日语论文写作格式日语教学日本社会文化日语开题报告日语论文选题

职称英语理工完形填空历年试题模拟试题补全短文概括大意词汇指导阅读理解例题习题卫生职称英语词汇指导完形填空概括大意历年试题阅读理解补全短文模拟试题例题习题综合职称英语完形填空历年试题模拟试题例题习题词汇指导阅读理解补全短文概括大意

商务英语翻译论文广告英语商务英语商务英语教学

无忧论文网

联系方式

俄语语法硕士论文定制-《俄语基本构句块的类型、及其算法和程序分析》

论文作者:英语论文论文属性:职称论文 Scholarship Papers登出时间:2011-10-24编辑:gufeng点击率:2649

论文字数:5724论文编号:org201110241554119776语种:中文 Chinese地区:中国价格:免费论文

关键词:构句块自动化处理俄语语法硕士论文定制

摘要:本文论述了构句块识别在语言自动分析中的地位,对俄语基本构句块进行了模式化分析,并对构句块识别的算法和程序进行了简要述说。

摘 要:要实现自然语言处理的各种目标,必须充分考虑语言的个性特征。对俄语相关论文中的几个基本构句块———动词性构句块、名词性构句块、形动词短语、副动词短语进行模式化分析,并且就如何对其进行自动识别编制具体的程序和算法,这对俄语句法信息的自动化处理具有重要的意义。

 

关键词:俄语;句法分析;构句块;自动化处理  

 

当今的自动句法分析(автоматическийсинтаксическийанализ)呈现出两种明显的趋势:一是引入统计法,把基于规则的方法和统计的方法结合起来;二是把句法和语义结合起来,实现句法—语义一体化分析。从俄罗斯有关计算语言学与机器翻译的文献来看,虽然两种趋势在个别新的俄语语言处理器(лингвистическийпроцессор)中都有所体现,但是,俄语句法分析器(синтаксическийанализатор)的设计主要还是采用基于规则的方法:在文法方面主要源于句子直接成分法、依存语法理论及传统语法的“词类—句子成分”理论;在算法方面主要基于上下文无关文法(контекстно-свободнаяграмматика)等形式文法思想。如,较有影响的ЭТАП机器翻译系列软件和ДИАЛИНГ等系统中的句法分析模块就是如此。当然,每个系统都有许多独到的处理方法和策略。我们认为,自然语言处理要充分考虑语言的个性特征。应该肯定,基于规则的方法对俄语句法分析来说是有效的,因为俄语是典型的屈折语,形态手段异常丰富,句法信息可通过词形特征计算出来。语言具有层级性,句法结构就是一个多层级结构,有直接构筑单位、次层级单位、三级单位等。至于有哪些这样的单位,他们是怎样构成句子的,这与语法理论相关。乔姆斯基转换生成语法把名词短语和动词短语作为直接单位: S→NP+VP;佐罗多娃(Г.А.Золотова)在交际句法中把句法素(синтаксема)视为句子的直接成分;俄语传统语法中的主语、谓语、补语三个主要成分实际上也正是句子的直接构筑单位。不论是上述句子的直接单位,还是其他单位都是由有限的构句块(синтаксическийблок/группа/сегмент)充任,其中基本的有动词性构句块(глагольныйблок)、名词性构句块(существительныйблок)、形动词短语(блокпричастногооборота)和副动词短语(блокдеепричастногооборота),本文对这四种基本构句块进行模式化分析,并就如何对其自动识别编制了具体的程序和算法,这对实现俄语句法信息的自动化处理具有重要的意义。

 

1.构句块识别在语言自动分析中的地位

 

在计算语言学中,自然语言处理被看做一个过程,该过程的起点或基础是作为信息源的各层面的静态语言知识,是由用于模式化分析和形式化表达的语言范畴知识和语言规则构成的信息库,此外,还应该包括待处理的自然语言(文本或有声言语)。终点则是该过程所实现的处理目标,也体现为静态的信息集,而过程本身体现为程序语句集合的动态操作,他们之间的关系可以表示如下:  


不论是何种俄语语言处理系统,一般都要经过以下几个标准处理阶段或称处理模块,各个阶段可借助上图的各个要素加以区别: (1)预前处理阶段,这个阶段的起始点是自然语言文本,处理终端是具有新的存储格式和系统内部组织形式的文件,其中含有文本编号、文本内部段落标记、语句编号等信息; (2)形态自动分析,这一阶段处理的起点是形态知识库以及文本成素(词形)的总和,处理结果是每个词形获得对应的原形形式及一系列语法属性的标注; (3)句段识别和切分处理,这个阶段起始点是上一个阶段形态分析的结果,终端是一定类型构句块的总和; (4)文本的语义句法分析,这个阶段的起始点是第三阶段处理的结果,终端是语义句法象(семантико-синтаксическийобраз),即带有句法语义属性的语句内部表达式的总和。  本文的基本构句块及其识别算法研究属于上述第三个处理阶段。我们认为,识别构句段是非常重要的,它是实现对语句整体语义句法结构的自动化处理的基础。

 

2.基本构句块的模式化分析

 

俄语中的四类基本构句块在构成特点、主导词、形态特征、句法功能等方面各不相同。
2•1 动词性构句块动词性构句块包括两种类型:(1)由副词和动词共同组成的字符串,其中动词是主导词,副词是依附词,如внимательнослушать、частоформироваться;(2)由动词和动词组成的合成性结构,其中后一个动词为主导词,如началчитать。
2•2 名词性构句块名词性构句块也包括两种类型:(1)前置词与名词的组合结构,其中主导词为名词,前置词为从属词,如вквартире、околодома;(2)由形容词、物主代词、指示代词、序数词等限定词与名词构成一致联系的结构,也包括前置词与这种结构的结合体,其中主导词为名词,前置词和限定词为从属词,如перваярека、вэтомразделе。
2•3 形动词短语形动词短语有两种结构:(1)被修饰名词在形动词之前,此时形动词左边的逗号和右边的第一个逗号之间的字符串为形动词结构;(2)被修饰名词在形动词之后,此时形动词至被修饰词之间的字符串为形动词结构。
2•4 副动词短语副动词短语在句中有三种分布位置:(1)句首,此时副动词之前的句号和之后的逗号之间的字符串为副动词短语;(2)句中,此时副动词两侧逗号之间的字符串为副动词短语;(3)句尾,此时副动词之前的逗号和之后的句号之间的字符串为副动词短语。

 

3.构句块识别的算法和程序

 

识别俄语语句构句块一般遵循以下操作顺序:首先实现动词性构句块的识别,然后从左到右进行扫描,找到所有名词,进而完成语句中所有名词性构句块的识别,在查找名词的过程中,如果发现形动词和副动词,则转入相应的识别程序,从而也达到识别形动词和副动词短语构句块的目标。在识别构句块的同时,还需要确定哪些构句成素的句法地位是等同的,充当同等句子成分(однородныечлены),从而识别出同等成分块。同等成分之间往往以逗号或连接词为标志符,并且通常属于同一词类,在形态特征上表现为一致关系。为了更好地理解下文展示的程序语句,有必要先明确几个基本概念:(1)形态群(морфологическаягруппа,МГ),指具有相同语法属性的一组词; (2)带分割符的形态群(морфологическаягруппасразделителями,МГР),指被逗号或连接词(и、или、либа)等分割的形态群; (3)形态—语义群(семантико-морфологическаягруппа,СМГ),指具有相同的语义—语法属性的一组词; (4)带分割符的形态—语义群(семантико-морфологическаягруппасразделителями,СМГР),指被逗号或连接词等分割的形态—语义群。
3•1 动词构句块的识别程序动词在语句中主要体现为以下形式:人称形式、命令式形式、假定式形式、不定式形式、形动词形式和副动词形式。我们可硬性地把命令式形式看做人称形式的一种,把假定式形式视为过去时形式与бы等词的合成结构,这样,如果当前句中某一字符串中含有动词和副词,并且动词体现为人称形式或不定式形式,则建立一个动词构句块。程序如下(暂用自然语言表示):———建立一个动词构句块如果当前词形为:a.副词:———归入当前动词构句块;b.动词不定式形式:如果该动词前面的词形为动词不定式形式,则———建立一个新的动词构句块;———把该动词归入当前动词构句块;———确认动词不定式这一属性;如果前置动词不包含在同等句子成分块中,则———建立一个同等句子成分块;否则,则———结合成一个同等句子成分块;否则,则———归入当前动词构句块;———确认动词不定式这一属论文英语论文网提供整理,提供论文代写英语论文代写代写论文代写英语论文代写留学生论文代写英文论文留学生论文代写相关核心关键词搜索。

共 1/2 页首页上一页12下一页尾页

英国英国 澳大利亚澳大利亚 美国美国 加拿大加拿大 新西兰新西兰 新加坡新加坡 香港香港 日本日本 韩国韩国 法国法国 德国德国 爱尔兰爱尔兰 瑞士瑞士 荷兰荷兰 俄罗斯俄罗斯 西班牙西班牙 马来西亚马来西亚 南非南非