学位论文 > 优秀研究生学位论文题录展示

互联网上旅游评论的情感分析及其有用性研究

作 者: 曹斌
导 师: 叶强
学 校: 哈尔滨工业大学
专 业: 管理科学与工程
关键词: 文本分类 情感倾向性分析 旅游业电子商务 评论有用性
分类号: TP391.1
类 型: 硕士论文
年 份: 2008年
下 载: 501次
引 用: 4次
阅 读: 论文下载
 

内容摘要


面对网络上日益丰富的评论信息资源,如何能快速有效的获取并使用其中的有效信息成为人们关注的问题。本论文研究目标是互联网上的旅游评论,通过使用数据挖掘算法分析获取评论中关于商品或服务的特征词,并提取所有评论中包含特征词的句子。利用LingPipe方法和PMI方法来分析这些特征句的情感倾向。并利用LingPipe方法和统计分析方法分析影响旅游评论有用性的因素。本文首先系统地介绍了旅游电子商务的相关知识。通过对旅游电子商务的基本概念和分类的介绍,总结了旅游电子商务的发展现状,并提出了旅游电子商务的发展趋势,为下一步的研究奠定基础。随后论文对文本分类和文本情感倾向分析的来源及原理作了简要地总结,介绍了几种主要的文本情感倾向分析分类的方法。在实验阶段,首先论文分析的是携程网上关于酒店的情感倾向性分析。论文本部分的研究目的是获知评论者对于某种产品或服务的某一特征的情感倾向。首先利用数据挖掘算法获得关于酒店评论者关注的特征词,并利用程序获得包含这些特征词的句子。然后论文通过使用LingPipe方法和PMI方法来分析关于某一特征的情感倾向,并根据实验过程和分类性能将两种方法进行比较。在第二部分研究中,本文主要分析了影响互联网上旅游评论有用性的因素。搜集整理了yahoo英文中旅游频道上的关于旅游目的地的评论,利用LingPipe方法获得评论中的主、客观特征值,建立固定效应对数线形回归方程和其改进模型分析得出主观、客观相交融且比较长的评论感知有用性最强。本研究可以快速地从海量评论中获得评论者对于某一产品或服务的某一特征的正负面评价,能更为有效地辅助阅读者的决策。且可以了解什么样的评论对阅读者帮助最大,相信本研究在未来能够得到很好的实践应用。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-16
  1.1 课题背景  9-11
  1.2 研究现状  11-13
    1.2.1 国外研究现状  11-12
    1.2.2 国内研究现状  12-13
  1.3 论文研究的研究框架及主要内容  13-16
第2章 旅游业电子商务的发展  16-22
  2.1 旅游电子商务的概念  16
  2.2 旅游电子商务的应用  16-18
    2.2.1 在旅游酒店中的应用  16-17
    2.2.2 在旅游交通中的应用  17
    2.2.3 在旅游目的地的应用  17-18
  2.3 旅游业网站分类  18-19
  2.4 旅游业电子商务发展现状及未来发展趋势  19-21
  2.5 本章小结  21-22
第3章 基于情感倾向的旅游评论分类  22-44
  3.1 文本分类介绍  22-24
    3.1.1 文本分类概念介绍  22-23
    3.1.2 文本分类的分类方法  23
    3.1.3 分类性能评估  23-24
  3.2 基于情感的文本分类理论介绍  24-25
  3.3 文本情感分类过程  25-26
  3.4 情感倾向判定方法  26-33
    3.4.1 逐点分析分类方法  26-28
    3.4.2 潜在语义分析分类方法  28-29
    3.4.3 LingPipe分类方法  29-30
    3.4.4 词网中的语义距离  30-33
  3.5 实验  33-43
    3.5.1 评论中特征抽取  33
    3.5.2 测试集  33-35
    3.5.3 LingPipe方法进行情感分析  35-41
    3.5.4 逐点分析方法进行情感分析  41-42
    3.5.5 LingPipe方法和逐点分析方法的对比  42-43
  3.6 本章小结  43-44
第4章 旅游评论的有用性分析  44-52
  4.1 客户认知  44-45
  4.2 影响客户认知的相关研究  45-46
  4.3 实验研究  46-51
  4.4 本章小结  51-52
结论  52-54
参考文献  54-58
附录  58-73
攻读学位期间发表的学术论文  73-75
致谢  75

相似论文

  1. 基于仿生模式识别的文本分类技术研究,TP391.1
  2. 基于数据分布特征的文本分类研究,TP391.1
  3. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  4. 基于树型条件随场的特定域事件提取方法研究,TP391.1
  5. 跨语言文本分类的研究,TP391.1
  6. 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
  7. 基于语义分析的文本挖掘研究,TP391.1
  8. 网络舆情分析关键技术研究与实现,TP393.09
  9. 基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究,TP391.1
  10. 基于关联技术的中文文本分类研究,TP391.1
  11. 软件缺陷自动分派研究,TP311.52
  12. 基于决策树分类算法的Web文本分类研究,TP391.1
  13. 结合本体HowNet的中文文本分类研究,TP391.1
  14. 基于集成学习的垃圾短信多级分类技术研究,TN929.53
  15. 基于NMF垃圾邮件过滤系统研究,TP393.098
  16. 互联网新闻热点挖掘系统的研究与实现,TP393.09
  17. 基于内容的Web新闻文本自动分类问题研究,TP391.1
  18. 中文文本分类方法研究,TP391.1
  19. 网络文本信息采集分析关键技术研究与实现,TP391.1
  20. 基于支持向量机与聚类算法的中文文本分类研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com