学位论文 > 优秀研究生学位论文题录展示
意见领袖发现及典型观点抽取技术的研究与实现
作 者: 宋凯嵩
导 师: 王大玲
学 校: 东北大学
专 业: 计算机软件与理论
关键词: 网络建模 意见领袖 正向意见领袖群 观点社区 典型观点抽取
分类号: G206
类 型: 硕士论文
年 份: 2012年
下 载: 8次
引 用: 0次
阅 读: 论文下载
内容摘要
随着Internet技术的迅速发展,众多的在线交流平台应运而生。论坛已经成为一种主要的信息交流平台,越来越多的网民通过论坛来发表观点和看法。在信息传播过程中,意见领袖被视为最具影响力的观点或其作者,其中正向意见领袖群代表一组用户,其观点可以引起回复者的共鸣,并且促使回复者表达相同的情感倾向。另外,针对一个事件,代表各种情感倾向的典型观点对于网络舆情分析具有重要的作用。基于此,本文研究Web论坛中意见领袖发现及典型观点抽取技术。首先,针对当前观点网络建模研究中主要考虑显式链接、而很少考虑隐式链接的问题,本文提出显式链接和隐式链接的发现方式,并且对发现的链接继续分为正向链接和负向链接,基于这些链接构建观点网络和用户网络模型,为进一步的意见领些发现和典型观点抽取打下基础。其次,基于上述观点网络建模方法,针对Web评论信息构建评论网络和用户网络,并提出Dynamic OpinionRank算法用以发现中文新闻评论中的意见领袖。进而通过聚类用户节点、计算用户的权威值、对评论和用户排序等手段,发现评论网络中最具有影响力的评论和用户网络中最具有影响力的用户。第三,在意见领袖动态检测的基础上,考虑多主题中正向意见领袖群的重要作用,进一步构建多主题用户网络,进而通过评论遍历过程中的用户权威值计算,将Top-k用户作为正向意见领袖群。第四,考虑典型观点在网络舆情分析中的作用,首先采用情感聚类技术划分评论集合成为观点社区,在各社区中构建情感短语树,依据本文提出的最长有序情感短语抽取算法发现观点社区的典型观点。上述各部分的实验表明,本文提出的方法能有效地发现Web上各种论坛内的意见领袖、正向意见领袖群以及各观点社区的典型观点。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-16 1.1 问题的提出 10-12 1.1.1 观点挖掘与网络舆情分析 10-11 1.1.2 意见领袖及其作用 11 1.1.3 典型观点及其作用 11-12 1.2 国内外现状 12-13 1.2.1 意见领袖的研究现状和分析 12 1.2.2 观点挖掘的研究现状和分析 12-13 1.3 本文研究的内容和目的 13-15 1.3.1 研究内容 13-14 1.3.2 研究目标 14 1.3.3 课题来源 14-15 1.4 本文的组织工作 15-16 第2章 相关理论及技术 16-22 2.1 文本预处理 16-17 2.1.1 中文分词技术 16 2.1.2 噪音剔除 16-17 2.1.3 文本格式转换 17 2.2 LDA模型表示 17-18 2.3 文本相似度 18 2.4 情感倾向性分析 18-19 2.5 社交网分析 19 2.5.1 基于度中心性的分析 19 2.5.2 基于权威的分析 19 2.5.3 基于PageRank的分析 19 2.6 DBSCAN聚类 19-20 2.7 本章小结 20-22 第3章 基于WEB论坛的观点网络建模 22-30 3.1 问题描述 22-24 3.1.1 问题提出 22 3.1.2 问题定义 22-24 3.2 链接发现 24-26 3.2.1 显式链接发现 24 3.2.2 隐式链接发现 24-25 3.2.3 正向链接发现 25 3.2.4 负向链接发现 25-26 3.3 单主题观点网络建模 26 3.4 单主题用户网络建模 26-27 3.5 多主题用户网络建模 27-28 3.6 本章小结 28-30 第4章 意见领袖动态检测 30-44 4.1 问题描述 30-32 4.1.1 问题提出 30-31 4.1.2 问题定义 31-32 4.2 情感分析及评论网络建模 32-35 4.2.1 情感分析 32-33 4.2.2 隐式链接发现 33-34 4.2.3 单主题观点网络建模 34-35 4.3 意见领袖动态检测 35-40 4.3.1 有限马尔科夫链模型 35-36 4.3.2 时间因素影响 36-37 4.3.3 有限马尔科夫链改进模型 37-38 4.3.4 最具影响力的评论检测 38-39 4.3.5 最具影响力的用户检测 39-40 4.4 实验及分析 40-43 4.4.1 实验设计 40-41 4.4.2 实验结果及分析 41-43 4.5 本章小结 43-44 第5章 正向意见领袖组检测 44-58 5.1 问题描述 44-46 5.1.1 问题提出 44 5.1.2 问题定义 44-46 5.2 链接发现 46-50 5.2.1 数据源的格式化和显式链接的发现 46 5.2.2 情感分析和正负向链接的发现 46-47 5.2.3 评论相似度计算和隐式链接的发现 47-50 5.3 正向意见领袖组检测 50-52 5.4 实验及分析 52-56 5.4.1 实验设计 52 5.4.2 实验结果及分析 52-56 5.5 本章小结 56-58 第6章 基于观点社区的典型观点抽取 58-72 6.1 问题描述 58 6.1.1 问题提出 58 6.1.2 问题定义 58 6.2 观点社区构建 58-60 6.2.1 情感词抽取 58-59 6.2.2 LDA语义分析 59-60 6.2.3 DBSCAN观点社区聚类 60 6.3 情感短语树的构建 60-64 6.3.1 情感短语和情感短语树的定义 60-61 6.3.2 情感短语的抽取 61-63 6.3.3 情感短语树的构建 63-64 6.4 最长有序情感短语的抽取 64-65 6.5 实验及分析 65-70 6.5.1 实验设计 65-66 6.5.2 实验系统说明 66-67 6.5.3 实验结果及分析 67-70 6.6 本章小结 70-72 第7章 结论及未来工作 72-74 7.1 本文主要工作 72-73 7.2 进一步工作 73-74 参考文献 74-78 致谢 78-80 攻硕期间参与项目及发表论文情况 80
|
相似论文
- 基于测量的Internet链路延迟建模,TP393.4
- 意见领袖与乡村和谐社会构建,G206
- 网络传播中的精英现象探究,G206
- 基于社会网络分析法的大学生网络意见领袖研究,G206
- 网络舆论监督中的意见领袖分析,G206
- 基于系统动力学的网络舆情应对问题分析,G206
- 离心式压缩机防喘振控制系统的实现,TH452
- 基于开放API的电子商务个性化服务推荐研究,TP391.3
- 网络传播中的意见领袖研究,G206
- 基于社会网络的集团人员构成研究,C931
- 无线Mesh网络传输性能分析和跨层协同优化算法的研究,TN929.5
- 微波非线性散射函数理论分析和基于递归神经网络大信号建模技术的研究,TN925
- 网络性能的分析评价模型及其软件实现,TP393.06
- 计算机网络优先级服务策略的建模研究,TP393.03
- 船用同步发电机混沌神经网络建模,U665.11
- 基于RBF神经网络的船舶大功率发电机建模,U665
- 公共阅读工作面色彩和人工光环境评价研究,TU113
- 永久散射体雷达差分干涉理论及在上海地面沉降监测中的应用,P225.1
- 复杂网络上基于流行病学的舆情传播模型及其规律研究,O157.5
- 具有意见领袖的网络环境下基于协同对策的策略互动,O157.5
- 嗅小球电生理网络建模及平台期型球周围细胞功能研究,R338
中图分类: > 文化、科学、教育、体育 > 信息与知识传播 > 信息与传播理论 > 传播理论
© 2012 www.xueweilunwen.com
|