学位论文 > 优秀研究生学位论文题录展示
基于依存关系的旅游景点评论文本倾向分析
作 者: 吴苏红
导 师: 王素格
学 校: 山西大学
专 业: 控制工程
关键词: 依存关系 旅游景点评论 文本情感分类 组块 特征-观点对
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 17次
引 用: 0次
阅 读: 论文下载
内容摘要
随着人们生活水平的提高,旅游已成为人们生活的重要组成部分。与此同时,关于旅游景点的网络评论也越来越多。这些评论对于潜在型游客和各地景点管理商都是非常重要的信息资源。对于一般游客,在出游之前,可以通过网上评论了解其他游客对某景点的看法,规划自己的旅游行程。而对于景点管理商可以通过景点评论了解游客对景点的意见和态度,以便提高旅游景点的服务质量。但是,人工地逐篇阅读大量的旅游景点评论,需要花费许多的时问和精力,阅读者极有可能会“迷失”在其中,无法正确识别和利用其中有价值的观点信息。为了准确、高效地挖掘出游客感兴趣的观点信息,对文本进行情感倾向性分析是需要解决的关键问题之一本文利用词对间的依存关系,研究了评论文本的情感倾向分类和特征-观点对抽取方法。本文的主要研究工作如下:(1)基于规则的组块获取为了抽取对情感倾向分类有用的信息,本文利用了词对问的依存关系,构建了获取含情感倾向组块的规则。实验结果表明,基于规则的方法获取组块是可行的。(2)基于组块特征的评论文本情感倾向性分类对于旅游景点评论文本的情感倾向分类的特征选择问题,本文将利用获取的组块与情感词相结合作为情感倾向分类的特征。通过对旅游景点评论的情感倾向分类实验,结果表明,采用组块信息可以提高文本情感倾向分类的性能。(3)特征-观点对的抽取特征-观点对的抽取是观点挖掘中重要的研究课题之一,本文利用依存语法对句子的分析,研究了评论文本中特征-观点对的抽取方法。利用词对间的依存关系,先构建了获取含有评价对象和观点词语组块的规则以及候选评价对象的识别算法。在此基础上,设计了具有情感倾向的特征-观点对的抽取算法。通过实验验证了方法的有效性。
|
全文目录
摘要 8-9 ABSTRACT 9-11 第一章 绪论 11-14 1.1 研究背景、目的及意义 11 1.2 国内外的研究现状 11-13 1.3 本文的研究工作 13 1.4 论文的组织结构 13-14 第二章 基于依存关系的文本情感倾向分类研究 14-29 2.1 依存语法 14-16 2.1.1 依存语法的相关研究 14-15 2.1.2 依存句法分析 15-16 2.2 组块的定义 16-24 2.2.1 名词组块 16-18 2.2.2 动词组块 18-21 2.2.3 形容词组块 21-24 2.3 基于规则的组块获取 24 2.3.1 获取情感倾向组块规则的建立 24 2.3.2 获取组块规则比较 24 2.4 实验结果与分析 24-28 2.4.1 实验数据与评价指标 24-26 2.4.2 组块获取实验结果与分析 26-27 2.4.3 文本情感分类实验结果与分析 27-28 2.5 本章小结 28-29 第三章 基于依存关系的文本特征-观点对抽取 29-37 3.1 评价对象与观点词语 29 3.1.1 评价对象 29 3.1.2 观点词语 29 3.2 含有评价对象和观点词语的组块获取 29-31 3.2.1 获取含评价对象和观点词语组块规则的建立 29-30 3.2.2 基于规则的组块获取算法 30-31 3.3 特征-观点对抽取 31-34 3.3.1 候选评价对象与观点词语的识别 31-32 3.3.2 特征-观点对的抽取 32-34 3.4 实验结果与分析 34-36 3.4.1 实验数据与评价指标 34 3.4.2 实验结果与分析 34-36 3.5 本章小结 36-37 第四章 结论与展望 37-39 4.1 结论 37 4.2 展望 37-39 参考文献 39-42 攻读硕士期间的研究成果 42-43 致谢 43-44 个人简介 44-46
|
相似论文
- 面向主题的Web文档自动文摘生成方法研究,TP391.1
- 目标导向与知识导向对无意识思维的作用研究,J502
- 面向网络舆情的中文评论文本情感倾向分析研究,TP391.1
- 基于语义分析的产品评论挖掘技术研究,TP391.1
- 现代汉语连动式兼语式复合词研究,H146
- 基于手机的移动学习资源设计研究,G434
- 词组任务型词汇记忆策略,H319
- 情感组块与机器学习相结合的文本倾向性分析,TP181
- 语义角色标注的集成策略的研究,TP391.1
- 基于依存关系的中文语义角色标注研究,TP391.1
- 工作记忆个体差异和记忆负荷对组块加工的影响,B842.3
- 多媒体环境下基于组块建构的英语词汇学习策略研究,H319
- 基于条件随机场的汉语多词块自动识别研究,H08
- 中文句子情感倾向分析,TP391.1
- 语义角色标注中的关键技术研究,TP391.1
- 认知无线电资源调度机制的研究,TN92
- 以组块为基础谈汉英文本中的平均结构难度,H052
- 中文问答系统的问句分类研究,TP391.1
- 中文文本情感分类的研究,TP391.1
- 面向图书评论的观点分析研究,G236
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|