学位论文 > 优秀研究生学位论文题录展示
面向情感倾向分析的微博表情情感词典构建及应用
作 者: 王文远
导 师: 王大玲
学 校: 东北大学
专 业: 计算机应用技术
关键词: 微博 表情符号 情感词典构建 情感分析 意见挖掘
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 10次
引 用: 0次
阅 读: 论文下载
内容摘要
微博客(即微博,Microblog)作为一种新的传播载体,是一个基于用户关系的信息分享、传播以及获取的平台。目前微博已经迅速进入了人们的生活,在网络舆情发起和传播中起着重要作用,并成为用户观点挖掘和网络舆情分析的重要数据源之一。同时微博用户发表的评论大多简短,并且含有多种数据形式,例如表情符号和视频等,因此除了用户的文本评论外,其他形式数据所含信息也是不容忽视的。表情符号作为一种新的网络语言,在微博中被广泛采用,在一定程度上代表了用户的情绪和思想,也将影响微博情感倾向分析的结果。本文提出基于微博数据统计结果为表情符号构建情感词典的思想,通过对大量微博中与表情“共现”的文本的情感倾向分析,确定表情的情感倾向,以此构建面向情感倾向分析的表情情感词典,旨在为微博、乃至其它采用表情符号的Web用户生成信息的情感倾向分析提供支持。进而,本文将表情情感词典反作用于对应的微博文本,生成一个新的情感词典,与现有的情感词典相结合进行情感分析,旨在获得更准确的情感倾向分析结果。进而,对于那些表情和文本共现的微博数据,本文提出了一种融合文字情感词典和表情情感词典共同计算情感倾向的算法来提高此类数据情感分析的正确性。实验表明了该方法的有效性,并分析了相关阈值的设置对结果的影响,从而获得更加有效的表情情感词典和辅助情感词典。
|
全文目录
摘要 5-6 Abstract 6-7 目录 7-10 第1章 绪论 10-16 1.1 研究的背景与意义 10-11 1.2 国内外研究现状和分析 11-13 1.2.1 意见挖掘研究现状 11-12 1.2.2 表情在意见挖掘中的作用 12 1.2.3 表情符号研究现状 12-13 1.3 问题提出 13 1.4 本文的研究内容 13-14 1.5 本组织结构 14-16 第2章 相关理论与技术 16-28 2.1 自然语言处理技术 16-18 2.1.1 分词技术 16-18 2.1.2 词性标注 18 2.2 文本情感倾向性分析与研究 18-23 2.2.1 情感信息抽取 19-21 2.2.2 情感分析资源 21-22 2.2.3 情感分析的应用 22-23 2.3 文本预处理 23-27 2.3.1 文本的特征提取 23-24 2.3.2 微博数据过滤 24-25 2.3.3 正则表达式 25-27 2.4 本章小结 27-28 第3章 表情符号在微博中的作用分析 28-34 3.1 表情符号在微博中的作用 28-30 3.1.1 微博数据特点 28-29 3.1.2 表情符号在微博中的作用 29-30 3.2 表情符号对微博情感分析的影响 30-31 3.2.1 短文本情感分析 30-31 3.2.2 表情符号在微博情感分析中的作用 31 3.3 结合表情的微博情感分析框架 31-33 3.4 本章小结 33-34 第4章 支持微博情感分析的表情情感词典构建 34-46 4.1 微博结构形式化定义 34-35 4.2 微博表情集合的构建及新表情的添加 35-40 4.2.1 微博数据获取及初始表情集合构建 35-37 4.2.2 初始表情集合获取 37-39 4.2.3 微博新表情自动识别 39-40 4.3 微博数据的预处理 40-42 4.4 微博文本的情感分析 42-44 4.4.1 情感词典构建 42 4.4.2 修饰词词典的构建 42-43 4.4.3 微博文本评论倾向性计算 43-44 4.5 微博表情情感词典构建 44 4.6 本章小结 44-46 第5章 基于文字和表情的微博情感倾向分析 46-52 5.1 表情词典在微博情感倾向分析中的应用研究 46 5.2 基于表情情感词典构建辅助情感词典 46-49 5.2.1 辅助情感词典构建 46-47 5.2.2 辅助情感词典与原有情感词典结合的情感分析 47-49 5.3 基于文本和表情的微博情感倾向性计算 49-51 5.4 本章小结 51-52 第6章 实验结果及分析 52-60 6.1 新表情添加 52-53 6.2 辅助情感词典构建及结合原有情感词典的情感分析 53-56 6.3 基于表情和文本评论的倾向性分析 56-57 6.4 对实验结果的分析 57-58 6.5 本章小结 58-60 第7章 总结及未来研究 60-62 7.1 总结 60 7.2 未来研究 60-62 参考文献 62-66 致谢 66-68 攻硕期间参与项目及发表论文 68
|
相似论文
- 风险视角下新浪微博融资行为研究,F49
- 当代广告舆论化现象研究,G206
- 微博:草根话语权的假象,G206
- 基于微博构建的公共领域研究,G206
- 论微博的公民话语权,G206
- 论微博客中的网络公众聚集现象,G206
- 多粒度融合的汉语句子主观性和情感分类方法研究,TP391.1
- 从都市报微博看都市报的数字化转型,G216.2
- 评价对象抽取研究,TP391.1
- 基于主题分类特征的物业评论情感分析,TP391.1
- 微博的受众心理研究,G206
- 中国网络自媒体时代下的交往行动研究,G206
- 针对教育视频的虚拟学习社区设计与实现,G434
- 基于微博客的社区挖掘研究,TP393.092
- 短文本情感分析技术研究,TP391.1
- 微博在危机事件中的传播特点和效果研究,G206
- “围脖”:用什么温暖大众?,G206
- 微博客的虚拟社群及其“人际化”传播分析,G206
- 微博客的传播特征及社会影响分析,G206
- 中国微博客的发展困境和策略研究,G206
- 基于微内容的新闻开发研究,G206
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com
|