英语论文网

留学生硕士论文 英国论文 日语论文 澳洲论文 Turnitin剽窃检测 英语论文发表 留学中国 欧美文学特区 论文寄售中心 论文翻译中心 我要定制

Bussiness ManagementMBAstrategyHuman ResourceMarketingHospitalityE-commerceInternational Tradingproject managementmedia managementLogisticsFinanceAccountingadvertisingLawBusiness LawEducationEconomicsBusiness Reportbusiness planresearch proposal

英语论文题目英语教学英语论文商务英语英语论文格式商务英语翻译广告英语商务英语商务英语教学英语翻译论文英美文学英语语言学文化交流中西方文化差异英语论文范文英语论文开题报告初中英语教学英语论文文献综述英语论文参考文献

ResumeRecommendation LetterMotivation LetterPSapplication letterMBA essayBusiness Letteradmission letter Offer letter

澳大利亚论文英国论文加拿大论文芬兰论文瑞典论文澳洲论文新西兰论文法国论文香港论文挪威论文美国论文泰国论文马来西亚论文台湾论文新加坡论文荷兰论文南非论文西班牙论文爱尔兰论文

小学英语教学初中英语教学英语语法高中英语教学大学英语教学听力口语英语阅读英语词汇学英语素质教育英语教育毕业英语教学法

英语论文开题报告英语毕业论文写作指导英语论文写作笔记handbook英语论文提纲英语论文参考文献英语论文文献综述Research Proposal代写留学论文代写留学作业代写Essay论文英语摘要英语论文任务书英语论文格式专业名词turnitin抄袭检查

temcet听力雅思考试托福考试GMATGRE职称英语理工卫生职称英语综合职称英语职称英语

经贸英语论文题目旅游英语论文题目大学英语论文题目中学英语论文题目小学英语论文题目英语文学论文题目英语教学论文题目英语语言学论文题目委婉语论文题目商务英语论文题目最新英语论文题目英语翻译论文题目英语跨文化论文题目

日本文学日本语言学商务日语日本历史日本经济怎样写日语论文日语论文写作格式日语教学日本社会文化日语开题报告日语论文选题

职称英语理工完形填空历年试题模拟试题补全短文概括大意词汇指导阅读理解例题习题卫生职称英语词汇指导完形填空概括大意历年试题阅读理解补全短文模拟试题例题习题综合职称英语完形填空历年试题模拟试题例题习题词汇指导阅读理解补全短文概括大意

商务英语翻译论文广告英语商务英语商务英语教学

无忧论文网

联系方式

分析互联网的发展及应用情况

论文作者:www.51lunwen.org论文属性:硕士毕业论文 thesis登出时间:2013-03-19编辑:hynh1021点击率:3027

论文字数:12600论文编号:org201303172254114818语种:中文 Chinese地区:中国价格:免费论文

关键词:互联网设计系统

摘要:我们要实现面向领域的观点挖掘系统,首先要有一个适合本文系统的观点词典。因为观点词典是整个系统的核心,是整个观点挖掘过程的关键所在,观点词典的质量好坏直接决定着观点挖掘的总体性能。

第1章  引言


1.1 研究背景和意义


   近些年来,随着互联网技术的迅猛发展和广泛普及,特别是Web2.0技术的推广应用,互联网迎来了又一个百花齐放的春天。博客(BLOG)、微博客(MicroBlog)、论坛(BBS)、社交网络(Social Network Service)、P2P(Peer-to-Peer)、即时信息(Instant Messaging)等网络技术的应用、普及,使越来越多的普通用户参与到互联网中来,并迅速成为了互联网上的主角,也使得互联网上的内容更加丰富多彩,信息量更是呈现爆炸式增长。特别是最近几年以来,智能上网手机的出现和应用,https://www.51lunwen.org/informationmanagement/ 不仅使得互联网变得随手可得,更是让互联网的各种优点发挥的淋漓尽致。截止到2012年6月份,我国的互联网用户就达到XX人,全球网页数达到。中国国家统计局2月22日发布数据称,2011年,3G移动电话用户12842万户,互联网上网人数5.13亿人,互联网普及率达到38.3%。互联网不仅成为了人们工作中不可或缺的重要组成部分,更成为了人们的又一种生活必需品。
   由于互联网信息量的指数倍飙升,互联网用户想要从浩瀚的互联网海洋中找到自己所关心和需要的信息变得越来越加困难。就在这种需求和大背景下,雅虎、谷歌、百度等搜索引擎门户网站迅速发展起来,并逐步成为用户数量最多的互联网应用。互联网用户可以通过这些搜索引擎门户网站快速查找和定位自己所关心的信息。但随着用户生成内容(UGC)的不断增多,这些通用搜索引擎网站显得越来越力所不及了。
   伴随着互联网产业的蓬勃发展,团购、网上商城等新兴互联网活动如雨后春笋般出现,其中网络购物更是异军突起,以其方便快捷、价格低廉等众多优点,迅速成为了互联网产业的重要组成部分,也逐渐成为人们在互联网上的主要消费行为之一。然而面对互联网上品种繁多,功能各异的产品,网络购买者根本无法辨别、选择;再加之人们生活节奏的日益加快,网络购买者根本没有时间和精力去商店亲身对比同一类别的各种产品的性价比,而后再去优中选优;又介于网络购物的局限性,网络购物者无法切身看到想要购买的商品实物,更无法亲身体验到所要购买服务的品质。这就使得大部分网络购物者不得不去借鉴已有网络购买者的消费体验,也就是参看已有的网络购买者对网络商品或者服务的评论信息,以权衡自己是否进行此次网络购物。介于这些评论信息越来越大的影响着网络购买者的购物活动,网络商家也更多的为网络购买者及评论者提供了发表观点意见的网络平台,以满足人们的购物需求;网络商家也可以关注这些评论信息,根据这些评论信息改正缺点,提高服务,进而增强自身产品的竞争力。鉴于以上需求,从互联网这个信息海洋中提取出这些评论信息有着现实的意义和极其重要的作用。就这样,网络产品评论信息的观点挖掘随之应运而生,并逐渐成为了互联网领域讨论和研究的热点。


1.2 观点挖掘的概念和相关内容


   观点挖掘也通常被称之为意见挖掘或者情感分析,是对互联网针对某对象的主观评论性信息进行检索、分类等处理,得到人们对所指对象的观点和看法。根据处理文本信息粒度的不同,观点挖掘可以分为篇章级、句子级、短语级等不同的挖掘层次。
   一般而言,观点挖掘过程包含三个主要子系统,既观点词典的构建,观点信息的检索以及观点信息的分类。
   作为观点挖掘核心内容的观点词典,是整个观点挖掘过程的关键所在,观点词典的质量好坏直接决定着观点挖掘的总体性能。观点词典的构建主要有基于规则、基于统计信息、基于语法信息以及基于上下文信息等多种方法。目前已有的比较著名和常用的观点词典,英文的有SentiWordNet、GI(general inquirer)等英文词典,中文的有 HowNet发布的观点词典、清华大学构建的观点词典、国立台湾大学的观点词典等,基于汉语文本的特殊性,近年来也出现了很多以属性词_观点词对构成的领域观点词典。
   观点信息的检索是观点挖掘过程的基础,它是从海量的互联网信息中将针对某对象且具有主观评论性信息的互联网页面检索出来并利用爬虫程序抓取下来。已有的传统观点信息检索一般可以分为两个层面,一个层面是对文本集合进行相关性检索,也就是传统的文本信息检索过程;另一个层面是判断检索出来的相关文本的主客观性,而在实际的应用中,观点信息的提取和判断大多都是一个统一的过程。目前广泛使用和流行的信息检索模型主要有布尔模型、向量空间模型、概率模型以及统计语言模型等,而文本的主客观性判别则主要是基于观点词典来进行实现。
   观点信息的分类,目的是对检索得到的主观性文本进行倾向性的判断。由于中文文本的语法结构复杂,文本信息含量繁多,同一个文本,甚至同一篇章、同一个句子都可能含有不同倾向性的内容,这就使得观点信息的分类工作变得更为复杂、困难。根据处理文本信息粒度的不同,观点信息的分类也可以分为篇章级、句子级以及短语级分类等。观点信息的分类常用的思路有基于观点词典的方法和基于特征分类的方法。基于观点词典的方法是一种无监督方法,其主要是依靠一些已有的观点词典和主观性文本中带有的观点极性信息对文本中的观点词进行统计计数,或者对文本、篇章及句子等进行倾向性评分,以对主观文本的极性进行判断;基于特征分类的方法主要是有监督的机器学习方法,通过选取如卡方、关键词等一些重要的、有意义的特征信息来构建训练集,以完成观点信息的分类。传统的机器学习方法,包括支持向量机(Support Vector Machine,SVM)、朴素贝叶斯模型(NBC)、条件随机场(Conditional random fields,CRF)、最近邻模型、最大熵模型等等。


1.3本文的主要工作


   本文基于观点挖掘技术和信息检索技术,以互联网上的产品评论信息为数据,设计和实现一个面向特定领域网络产品的观点挖掘系统,用户可以通过向本系统提交所要了解的产品名称的查询词,得到查询词各个属性的正面评价和负面评价信息,用户也可以根据选择自己关心的属性进行更细致查询。本文系统相对于已有的观点挖掘系统具有更高的实用性和较大的创新性,在召回率等方面有明显提高。具体内容可以概括如下:
(1)本文针对特定领域的网络产品,构建特定领域观点词典,也可以理解成构建特定领域网络产品的本体。鉴于汉语文本的特殊性、复杂性,本文构建的特定领域观点词典包含特定领域网络产品属性词(即特征词)-观点词对(简称属性-观点对(特征-观点对)),以及特定领域网络产品属性词-观点词对的倾向性标注(正向,负向,中性)。在特定领域观点词典的构建中,包含特定领域网络产品属性词和观点词的提取,以及其倾向性的判断及标注。特定领域观点词典的构建思路及构建算法较已有观点词典都有较大的创新和较高的效率提升。
  (2)通过前面得到的属性词-观点词对信息,构建观点词-属性词对集合,提取出含有隐式属性词的情况,结合特定领域网络产品评论数据的特点,设计和实现观点信息检索子系统,将属性词-观点词对信息加入到已有的观点检索模型之中,使得观点检索模型的效能有较大程度的提升,加入隐式属性词的提取,也使得召回率有明显提高。
  (3)基于观点信息检索子系统检索得到的数据结果,设计实现观点信息分类子系统,基于前面构建的融合有监督的机器学习分类方法和基于情感词典的无监督的分类方法,通过观点信息的分类算法对评论文本进行句子级的倾向性分类,以提高观点信息的分类效率。


1.4 本文的组织结构


  第一章 介绍了本文课题的研究背景、应用价值及研究意义,概述了观点挖掘的相关概念及内容,本文的主要工作和研究内容以及本文各个章节的内容安排。
  第二章 基于本文系统的设计思路和工作原理,提出了本文系统结构的总体框架。
  第三章 构建特定领域观点词典,介绍构造构建特定领域观点词典的具体算法,包括显式属性词和隐式属性词的提取算法,观点词的提取算法论文英语论文网提供整理,提供论文代写英语论文代写代写论文代写英语论文代写留学生论文代写英文论文留学生论文代写相关核心关键词搜索。

共 1/2 页首页上一页12下一页尾页

英国英国 澳大利亚澳大利亚 美国美国 加拿大加拿大 新西兰新西兰 新加坡新加坡 香港香港 日本日本 韩国韩国 法国法国 德国德国 爱尔兰爱尔兰 瑞士瑞士 荷兰荷兰 俄罗斯俄罗斯 西班牙西班牙 马来西亚马来西亚 南非南非