学位论文 > 优秀研究生学位论文题录展示

基于中文微博的情感分析研究

作 者: 徐帅
导 师: 文坤梅
学 校: 华中科技大学
专 业: 计算机应用技术
关键词: 中文微博 情感分析 句法依存关系 文本分类
分类号: TP393.092
类 型: 硕士论文
年 份: 2013年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


微博即微博客,日益成为当今最炙手可热的互联网应用。据统计,平均每天产生的微博数量高达1亿条,在这海量的数据中不仅包含着对客观性事实的描述信息,同时还蕴含着大量微博用户的情感状态、观点看法等主观性信息。而这些主观性信息不仅有助于用户决定是否去购买某个产品,而且对于商家制定产品营销策略也具有重要的参考价值,甚至在舆情监控领域也为政府部门提供了有效的数据来源。基于此,针对中文微博设计了基于句法依存关系和文本分类技术相结合的微博情感分析方法。该方法利用句法依存关系初步判断出微博评论的情感倾向性,同时计算出结果的置信度,选择置信度高于特定阈值的结果作为训练样本,并结合微博内容特征集和微博媒体特征集训练得到一个两步情感分类器,该分类器第一步对微博进行主客观识别,第二步则对主观性微博再次进行情感极性分类。另外,在训练集的选择上,利用微博中常用的表情符号来自动标注训练样本,并实现了一个自增式的学习策略来解决微博实时情感分析问题。实验表明,相比仅利用句法依存关系的方法,该方法在正确率和召回率上分别提高了6%和3%。特征的选择方面,微博内容特征集和微博媒体特征集均优于一元文法特征的分类效果,其中主客观分类的正确率和召回率均可达88%,情感极性分类则分别为72.1%和71.5%,尤其是基于微博媒体特征集的情感分类方法更适合解决微博实时情感分析问题。

全文目录


摘要  4-5
ABSTRACT  5-8
1 绪论  8-16
  1.1 课题研究背景  8-9
  1.2 课题的研究目的和意义  9-10
  1.3 国内外研究现状  10-14
  1.4 论文的研究内容  14-15
  1.5 论文结构安排  15-16
2 微博相关研究工作综述  16-22
  2.1 微博社会网络的特性分析  16-19
  2.2 微博文本内容的语义分析  19-20
  2.3 微博中的应用研究分析  20-21
  2.4 本章小结  21-22
3 基于句法依存关系的微博情感分析  22-42
  3.1 句法依存关系概述  22-24
  3.2 微博预处理  24-27
  3.3 BAG-OF-TARGETS 模型  27
  3.4 评价词及评价对象抽取规则  27-30
  3.5 情感倾向性判别  30-36
  3.6 实验评估  36-40
  3.7 本章小结  40-42
4 基于文本分类的微博情感分析  42-61
  4.1 文本分类技术概述  43-44
  4.2 训练样本集的选择  44-49
  4.3 样本预处理  49-50
  4.4 主客观分类特征  50-52
  4.5 情感倾向性分类特征  52-53
  4.6 实验分析  53-60
  4.7 本章小结  60-61
5 总结与展望  61-63
  5.1 论文工作总结  61-62
  5.2 进一步研究方向  62-63
致谢  63-65
参考文献  65-71
附录 1 攻读硕士学位期间参与的科研项目  71-72
附录 2 攻读硕士学位期间取得的科研成果  72

相似论文

  1. 基于仿生模式识别的文本分类技术研究,TP391.1
  2. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  3. 基于本体的中文科技论文分类研究,TP391.1
  4. 基于词跨度的中文文本关键词提取及在文本分类中的应用,TP391.1
  5. 评价对象抽取研究,TP391.1
  6. 基于主题分类特征的物业评论情感分析,TP391.1
  7. 基于粗糙集理论的文本分类研究,TP18
  8. 基于贝叶斯过滤的文本分类技术的研究与实现,TP393.098
  9. 基于内容的中文垃圾短信分类技术的研究,TP391.1
  10. 一种于经验数据的软件缺陷修复工作量预测模型研究,TP311.53
  11. 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
  12. 基于关联规则和图排序的句子情感倾向性研究,TP391.1
  13. 基于支持向量机的文本分类器设计与实现,TP391.1
  14. 模糊理论在文本分类中的应用研究,O159
  15. 基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究,TP391.1
  16. 软件缺陷自动分派研究,TP311.52
  17. 基于内容的垃圾邮件过滤技术的研究,TP393.098
  18. 网络舆情预警辅助决策支持系统模型及关键技术研究,TP393.09
  19. 基于支持向量机的新闻自动分类技术的研究与应用,TP391.1
  20. 基于Lucene的期刊网站内信息检索系统的设计与实现,TP391.3
  21. 主题搜索引擎中相关技术的研究与实现,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com