学位论文 > 优秀研究生学位论文题录展示
基于网络评论的客户观点挖掘方法研究
作 者: 梁雷
导 师: 闫相斌
学 校: 哈尔滨工业大学
专 业: 管理科学与工程
关键词: 观点挖掘 特征提取 极性提取 观点分类 客户口碑
分类号: TP393.09
类 型: 硕士论文
年 份: 2010年
下 载: 290次
引 用: 2次
阅 读: 论文下载
内容摘要
互联网已经融入我们的日常生活,与我们的工作和学习密不可分。网络的迅速普及和快速发展使得互联网承载了无比巨大的信息。自从进入Web2.0时代以来,各种各样的信息资源更是丰富多彩,各种新型的交互网站也逐渐兴起。互联网用户更多的参与进来,他们可以通过网络媒体发表看法和意见等信息。本文详细探讨了针对网络评论内容进行观点挖掘的相关理论和方法,设计了观点挖掘的实现过程。本文通过对观点倾向分类的方法和过程的实现来分析客户行为和观点倾向,详细研究了观点挖掘中特征和极性提取方法和过程,并分析了客户观点表达的规律。本文结合网络评论内容的上下文特点对网络用户的观点进行总结并分析了解客户的语义倾向。研究中收集了来自于网上的大量客户评论内容,本文对这些数据进行了结构化处理,并进行分词和标注以便于进一步分析。我们对预处理后的数据进行特征提取并表示成向量空间的形式,通过运用计算机自动分类的方法对预处理后的文本数据按照不同的属性进行观点分类。在分类的过程中,本文使用了支持向量机的方法并运用Weka软件进行针对每个含有星数的属性进行分类,研究中还对分类过程和方式进行改进以求达到更好的观点分类效果,通过对分类结果的分析我们发现了评论中隐藏的客户观点表达规律,这方面的知识有助于商家更加有针对性地了解客户。网络评论中常常包含有客户对各种商品及属性的评价,这些内容对我们来说也是有价值的。本文研究了评论对象及其属性特征的挖掘方法并设计了挖掘的过程。研究中通过运用词频统计和互信息值计算等方法设计了被评价事物及特征提取的过程,再结合语义规则和知网语义分析等手段进行极性提取。本文提取了被客户打上星数的属性特征的子特征并进行了展示。本文还运用统计理论和方法分析了客户口碑对商业方面的影响。客户的网上评论是以口碑的形式进行传播,这种网络口碑无疑对客户和商家的交易行为产生很大影响,研究中客户观点倾向对店铺回头率的影响分析帮助我们更加了解客户行为规律。本文试图通过对观点挖掘的研究为相关领域研究提供参考,帮助商家更好地了解客户并进行客户关系管理,为客户的消费决策提供更好的支持。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第1章 绪论 9-21 1.1 课题研究的背景 9-11 1.2 研究的目的与意义 11 1.3 国内外研究综述 11-18 1.3.1 文本挖掘技术综述 11-15 1.3.2 针对评论的观点挖掘综述 15-18 1.4 本文主要研究内容 18-19 1.5 论文架构 19-21 第2章 评论观点挖掘研究设计 21-37 2.1 数据收集与处理 22-27 2.1.1 数据收集的方法 22-23 2.1.2 数据情况介绍 23-24 2.1.3 数据结构化处理过程 24-27 2.2 分词与标注 27-30 2.2.1 自动分词理论和方法 27-29 2.2.2 词性标注过程 29 2.2.3 本文数据处理情况 29-30 2.3 评论文本挖掘 30-34 2.3.1 特征选择方法 30-31 2.3.2 数据表示方法 31-33 2.3.3 挖掘分析 33-34 2.4 观点识别与总结 34-35 2.5 客户口碑的影响 35 2.6 本章小结 35-37 第3章 客户观点分类方法研究 37-48 3.1 文本分类模型 37-40 3.2 分类结果的评价 40-41 3.3 客户观点分类过程 41 3.4 实验分析 41-47 3.4.1 五个级别的观点分类 42-44 3.4.2 三个级别的观点分类 44-46 3.4.3 数据分布均匀的观点分类 46-47 3.5 本章小结 47-48 第4章 客户观点识别过程 48-59 4.1 互信息的应用 48 4.2 被评价对象及特征的识别 48-50 4.2.1 被评价对象识别流程的设计 48-49 4.2.2 被评价对象及特征识别过程 49-50 4.2.3 子特征的识别过程 50 4.3 极性词的提取 50-53 4.3.1 基于语义规则的极性提取过程 50-52 4.3.2 基于Hownet 的极性提取过程 52-53 4.4 观点展示过程 53-54 4.5 实验分析 54-58 4.6 本章小结 58-59 第5章 网络口碑的商业效应 59-65 5.1 网络口碑的商业特点 59-61 5.1.1 网络口碑在营销中的优势 59-60 5.1.2 网络口碑的不足 60-61 5.2 网络口碑对客户回头率的影响 61-63 5.2.1 客户口碑对客户重购行为的影响 61 5.2.2 实验分析 61-63 5.3 本章小结 63-65 结论 65-67 参考文献 67-72 致谢 72
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于图像的路面破损识别,TP391.41
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于小波变换的三维模型特征提取技术的研究与实现,TP391.41
- 基于本体的中文科技论文分类研究,TP391.1
- 面向观点挖掘的汽车本体知识库建立研究,TP391.1
- 基于茧丝纤度序列的多总体分类判别及其比较,O212
- 基于改进的支持向量机的模拟电路故障诊断方法研究,TN710
- 基于DSP的水稻杂草识别研究,TP391.41
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 基于神经树的人脸识别方法研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|