英语论文网

留学生硕士论文 英国论文 日语论文 澳洲论文 Turnitin剽窃检测 英语论文发表 留学中国 欧美文学特区 论文寄售中心 论文翻译中心 我要定制

Bussiness ManagementMBAstrategyHuman ResourceMarketingHospitalityE-commerceInternational Tradingproject managementmedia managementLogisticsFinanceAccountingadvertisingLawBusiness LawEducationEconomicsBusiness Reportbusiness planresearch proposal

英语论文题目英语教学英语论文商务英语英语论文格式商务英语翻译广告英语商务英语商务英语教学英语翻译论文英美文学英语语言学文化交流中西方文化差异英语论文范文英语论文开题报告初中英语教学英语论文文献综述英语论文参考文献

ResumeRecommendation LetterMotivation LetterPSapplication letterMBA essayBusiness Letteradmission letter Offer letter

澳大利亚论文英国论文加拿大论文芬兰论文瑞典论文澳洲论文新西兰论文法国论文香港论文挪威论文美国论文泰国论文马来西亚论文台湾论文新加坡论文荷兰论文南非论文西班牙论文爱尔兰论文

小学英语教学初中英语教学英语语法高中英语教学大学英语教学听力口语英语阅读英语词汇学英语素质教育英语教育毕业英语教学法

英语论文开题报告英语毕业论文写作指导英语论文写作笔记handbook英语论文提纲英语论文参考文献英语论文文献综述Research Proposal代写留学论文代写留学作业代写Essay论文英语摘要英语论文任务书英语论文格式专业名词turnitin抄袭检查

temcet听力雅思考试托福考试GMATGRE职称英语理工卫生职称英语综合职称英语职称英语

经贸英语论文题目旅游英语论文题目大学英语论文题目中学英语论文题目小学英语论文题目英语文学论文题目英语教学论文题目英语语言学论文题目委婉语论文题目商务英语论文题目最新英语论文题目英语翻译论文题目英语跨文化论文题目

日本文学日本语言学商务日语日本历史日本经济怎样写日语论文日语论文写作格式日语教学日本社会文化日语开题报告日语论文选题

职称英语理工完形填空历年试题模拟试题补全短文概括大意词汇指导阅读理解例题习题卫生职称英语词汇指导完形填空概括大意历年试题阅读理解补全短文模拟试题例题习题综合职称英语完形填空历年试题模拟试题例题习题词汇指导阅读理解补全短文概括大意

商务英语翻译论文广告英语商务英语商务英语教学

无忧论文网

联系方式

研究学术领域中的“V+N

论文作者:佚名论文属性:短文 essay登出时间:2009-11-22编辑:lisa点击率:6895

论文字数:2000论文编号:org200911220045373590语种:英语 English地区:中国价格:免费论文

附件:研究学术领域中的V+N搭配结构.doc

关键词::"V十N词性搭配述宾结构定中结构汉韩机器翻译

摘要:本文工作主要针对学术领域中的“V+N"搭配结构来进行研究.我们以《语法信息词典详解》文本为测试对象,利用已有的汉语文本处理工具来自动获取搭配词组.通过分析可知:V十N的搭配结构与领域密切相关.学术领域语料中常出现定中结构的“V+N"搭配.定中结构的V+N和述宾结构的V+N之间有不同的出现条件.根据这些,#'1断规则有助于计算机在汉韩机器翻译中自动处理“V十N"结构,可按照动词和名词的语义关系选择格助词和语尾,生成韩文.
       引言
      从机 器 翻 译的角度看,一些多词组合或搭配在特定的语言环境中,往往需要作为一个整体来进行翻译。在学 术 领 域里经常出现的“V+N”的搭配结构有什么样的特点?对机器翻译有参考价值何在?这是本文要探讨的问题。研究方法如下:
     (一 )语 料 的来源:一是《现代汉语语法信息词典详解》第二版(2003),这是本文主要观察的对象。另一语料来源是《计算语言学概论》(2003)、《北大计算语言学论文集1-4)(1996-2000)、《汉语语言与计算学报Vol 13) (2003),这些语料作为参考语料。
      (二 )利 用 己有的汉语文本处理工具来自动获取搭配词组。
      (三 )对 自 动获取的搭配候选词组进行定量分析和定性分析。
      (四 )根 据 分析结果来制定一些汉韩翻译策略。
      1 "V+N”搭配词组获取的流程
      1.1 语料的预处理
      本文 工 作 使用了《现代汉语语法信息词典详解》(以后简称《详解》),该书介绍电子版《现代汉语语法信息词典》的基本结构及理论背景。我们从《详解》中选择了4300多个句子(约17万汉字)进行分析。对这个语料进行预处理时分几个步骤进行。
     (一 ) 把 《详解》文本格式转换成纯文本格式,然后在文本语料中删除不必要的地方,如图表、参考文献、附录、英文摘要等。 
     (二 ) 中文 词性标注:为了获取词语之间的搭配信息,我们对这些纯文本语料进行词语切分和词性标注。我们用北大计算语言学研究所的词法分析系统进行中文分词和词性标注‘。
      1.2 自动获取“V+N ;搭配词组
      对标 注 语 料进行自动获取"V千N”搭配词组时,本文利用北大计算语言学研究所研制的两个系统一“基于统计的翻译等价词对获取系统(MWU1) "(常宝宝,2002)和“基于统计的自动搭配抽取系统”(于江生,2003)。这两个系统都能从词性标注语料中自动抽取各种词性序列的搭配词组,本实验限定范围、添加条件,试图抽取动词名词搭配的结构。抽取时,考虑两个判定条件,第一,动词和名词要在文本中稳定共现。第二,该词语的组合具有合理句法结构。就第一个条件,为了判定共现的程度,我们参考统计关联度的办法,如互信息(MI) , DICE系数、对数可能性(LogLikelihood)分值和x,统计值(或CHI square value)。为了动词和名词的共现概率,本文按照对数可能性(LL)分值和x'统计值。这是因为对数可能性分值以及统计值的抽取效率比较可靠(常宝宝2002:27-28)0就第二个条件,搭配通常是具有一定结构的。从结构上看,这些搭配可以是各种不同词类的组合z,本实验限定范围,符合“动词(V卜名词(N)”结构的词组才能被选为搭配词组候选。 
      2实验结果分析
       基于 上 述 的方法,我们对计算语言学领域的语料进行了一些实验,作为测试语料,我们从《详解》中选择了4300多个句子进行获取“V+N;搭配词组,。从测试结果中,我们选择获取结果的前100个“V+N”词组进行分析。词组 的 正 确处理及翻译,依赖于上下文环境。“V+N”搭配结构也是如此既可构成述宾结构,如“使用语言”,也可构成定中结构,如“使用价值”。目前常宝宝(2002)的系统和于江生(2003)的系统,按照词性序列进行获取搭配结构,但还没设计到词性序列上存在的歧义结构分类功能。所以我们通过人工分类的方法,对获取的“V十N”词组进行结构分析。我们选择获取结果的前100个词组进行分类,得到如下的数据:(一)我们用常宝宝(2002)的系统自动获取“V+N0形式的搭配候选,分值前100个实例中,述宾结构的搭配词组为49个,定中结构为26个, 不合法结构的搭配候选为25个。(二)我们利用于江生(2003)的系统一共获取92个搭配词组候选,其中构成述宾结构的词组是42个。定中结构的词组是38个,不合法结构的搭配候选是12个。
      2. 定中结构的搭配词组
      下面 是 《 详解》语料中构成定中结构的“V+N”搭配词组:

上,“搭配”指的是词与词之间的“共现”现象。而且这种“共现”现象受一定的句法上的限制和语义上的限制。除了这些特征以外,词的搭配范围与其专门化程度有关。除日常交际中的常用搭配外,对应各专门领域,还有大量的、作用范围仅限于该领域的特定搭配,如某些专业技术术语及领域习惯用语。就《详解》语料中自动获取的结果而言,“计算+语言学”、“趋向+补语”、“登录十项”、“简称十略语”、“使用+频度”、“兼类十现象”、“鉴别+准则”也属于这种
专业性搭配。
      为了 证 实 这种现象,本文对1998年人民日报语料5000个句子(20万个汉字)进行获取“V+N.1搭配词组的实验,然后对结果前100个实例进行比较。我们通过下面的表可以发现学术领域的语料和新闻领域的语料有搭配习惯上的差异:

      从上 面 的 表中我们可以看出《人民日报》语料中构成定中结构的“V+N;搭配词组的比例比较低,如前100个结果中可以分析为定中结构的搭配词组只有7个,如“下岗职工”、“联合医院”、“下滑趋势”、“审计机构’,、“引导作用”等。大都情况下“V+N”搭配词组都构成述宾结构(74%),跟《人民日报》语料相比,《详解》中,构成定中结构的动名搭配词组相当多。 
     1.V+ N” 定 中结构格式整体功能相当于名词,它不像动词形成的其他结构,表示指称意义。那么什么样的动词能进入这种格式呢?就"VIN”定中结构的构成而言,动词“V”和名词“N"有多方面的选择限制,包括语音形式、语义类属、配价成分等。   
        第一 , 在 语音形式上,能进入“V+N”定中结构框架的动词和名词,一般是双音节形式,通常构成“2+2”组合式.如“计算模型”、“鉴别准则”等。少数单音节名词直接受双音节动词修饰,形成“2+1”组合式的“V+N”格式,这种定中结构都具有凝固性,大多视为复合词。如“说话人”、“讨论班”、“兼类词”等。
       第二 , 从 词类的角度来看,这些动词大多具有所谓“名动词”的特征,可以中间不带论文英语论文网提供整理,提供论文代写英语论文代写代写论文代写英语论文代写留学生论文代写英文论文留学生论文代写相关核心关键词搜索。

共 1/3 页首页上一页123下一页尾页

相关文章

    英国英国 澳大利亚澳大利亚 美国美国 加拿大加拿大 新西兰新西兰 新加坡新加坡 香港香港 日本日本 韩国韩国 法国法国 德国德国 爱尔兰爱尔兰 瑞士瑞士 荷兰荷兰 俄罗斯俄罗斯 西班牙西班牙 马来西亚马来西亚 南非南非