学位论文 > 优秀研究生学位论文题录展示
基于用户评论信息的商品推荐技术
作 者: 李慧
导 师: 沈洁
学 校: 扬州大学
专 业: 计算机应用与技术
关键词: 信息抽取 熵 情感分类 电子商务 页面排名 产品推荐
分类号: TP393.09
类 型: 硕士论文
年 份: 2007年
下 载: 271次
引 用: 2次
阅 读: 论文下载
内容摘要
随着World Wide Web(简称WWW,Web)的迅速发展,Web上信息与日俱增,互连网已成为人们获取信息的重要来源。但是,由于因特网的广泛性和开放性,在因特网上发布信息极为容易而且不受限制,无论任何单位、团体、个人只要具备上网条件便可以自由地在因特网上发布信息,从而加剧了因特网信息的急速膨胀。因此,如何快速、准确地从浩瀚的信息资源中寻找所需的信息已经成为困扰用户的一个难题。目前,电子商务也正以令人难以置信的速度蓬勃发展着。在新的商业环境中,怎样挖掘出新的潜在用户,并确保自己的产品可以吸引住客户,成为众多开展电子商务的企业亟待解决的问题。电子商务网站如何尽可能地了解用户的喜好而进行有效的产品推荐,使得商家能够根据用户对产品的满意程度来及时调整产品的生产、宣传工作从而实现更好的销售。因此,如何为商务网站提供这些具有商用价值的信息也成为目前研究的热点。基于互联网进行的信息推荐技术,正是解决以上这些难题的有效手段。它有利于用户从因特网这个信息海洋中寻找所需的信息资源,并推荐其所需要的服务,同时也能够让商家获得用户对其产品的反馈信息。信息推荐技术将便利用户获取网络上的信息,同时也加速了知识共享、知识学习和知识的创造过程。因此,对基于互联网进行信息推荐技术的研究,具有很高的商业价值与学术价值,具有重要的研究意义。本文主要做了以下几方面工作:1.用户评论信息的发现与抽取:本文提出了一种新颖的算法来发现并抽取页面中的用户评论信息。该算法首先将页面分割成多个语义块,然后通过计算各语义块的熵值来量化此语义块为评论块的概率大小,从而自动实现对用户评论信息块的抽取。实验表明新的算法可以得到很高的抽取质量与抽取效率。2.用户评论信息的情感分类:本文提出了一个简单而有效的方法来完成情感分类工作,即利用WordNet中形容词的同义词集合及反义词集合来定位评论句中形容词的语义性。实验表明新的算法可以得到满意的分类结果。3.流行商品推荐技术:分析用户对商品的评论信息,最终是为用户进行产品推荐服务。通过分析每一个评论句的语义性,可以统计出某一商品所得到的好/差评总数。由于用户通过搜索引擎搜索商品时,都希望返回目前最流行,最能体现产品质量与用户反响的产品页面。因此,本文提出了一种新的页面排名算法。该算法综合产品页面自身的重要度与该产品所得的好评率,对搜索引擎返回的结果再次进行排序,从而实现将流行的商品推荐给用户。实验表明新的算法可以提高用户对产品搜索结果的满意度。
|
全文目录
中文摘要 5-7 英文摘要 7-9 1 绪论 9-15 1.1 论文的研究背景和选题意义 9-10 1.2 论文的研究内容及主要问题 10-13 1.2.1 Web 信息抽取技术 10-12 1.2.2 Web 页面推荐技术 12-13 1.3 本文提出的主要技术 13-14 1.4 论文的结构 14-15 2 Web 挖掘技术 15-27 2.1 Web 挖掘概述 15-16 2.1.1 Web 挖掘定义 15 2.1.2 Web 挖掘分类 15-16 2.2 Web 内容挖掘 16-19 2.3 Web 结构挖掘 19-23 2.3.1 PageRank 算法 19-21 2.3.2 HITS 算法 21-23 2.4 Web 使用挖掘 23 2.5 Web 挖掘中存在的问题及发展趋势 23-25 2.5.1 当前Web 挖掘中存的问题 23-24 2.5.2 Web 挖掘技术发展趋势 24-25 2.6 本章小节 25-27 3 基于页面分块与信息熵的评论抽取技术 27-41 3.1 引言 27 3.2 相关工作 27-29 3.2.1 关联规则挖掘 27-28 3.2.2 语义块分割 28-29 3.2.3 信息熵理论 29 3.3 评论信息抽取算法 29-35 3.3.1 语义块分割 30 3.3.2 计算各块的熵值 30-35 3.3.2.1 抽取各块中的特征词 31-32 3.3.2.2 内容块的熵值计算 32-35 3.4 实验结果分析 35-39 3.4.1 H(CB)阀值验证实验 36-37 3.4.2 算法有效性验证实验 37-39 3.5 本章小结 39-41 4 基于WordNet 的情感分类技术 41-49 4.1 引言 41-42 4.2 相关工作 42 4.2.1 分类算法 42 4.2.2 情感分类 42 4.3 评论词的情感分类 42-45 4.4 评论句的情感分类 45-47 4.5 实验结果分析 47-48 4.6 本章小结 48-49 5 基于用户评论信息的产品页面排名技术 49-61 5.1 引言 49 5.2 相关工作 49-53 5.2.1 传统IR 的相关排名技术 50-52 5.2.2 GOOGLE 搜索推荐算法 52-53 5.3 基于用户信息的产品页面推荐算法 53-55 5.4 系统构架 55-58 5.5 实验结果分析 58-59 5.5.1 实验数据集 58-59 5.5.2 实验结果及用户评价 59 5.6 本章小结 59-61 6 总结与展望 61-63 6.1 本文工作总结 61 6.2 未来工作展望 61-63 参考文献 63-69 攻读硕士学位期间已发表论文及参加科研项目 69-71 致谢 71
|
相似论文
- 偏振条件下辐射能和熵传输的数值模拟,TK124
- 流动与混合过程中不可逆损失的研究,TK12
- 基于信息熵的课堂观察量化评价模型研究,G632.4
- 领域实体属性及事件抽取技术研究,TP391.1
- 时间表达式识别与归一化研究,TP391.1
- 人物言论抽取与跟踪技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 图像分割中阴影去除算法的研究,TP391.41
- 基于停用词处理的汉语语音检索方法,TP391.1
- 桡动脉超声多普勒血流信号的特征提取及分类研究,TP391.41
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 公路生态系统健康评价方法研究,X826
- 服装网络营销顾客忠诚度的实证研究,F274
- 中等职业学校语文课业设计的思考与实践,G633.3
- D.R.斯汀森《密码学》中一些传统编码与破译方法的改进,TN918.1
- 论《联合国国际货物销售合同公约》在适用范围上的新发展,D997.1
- 汉语框架自动识别中的歧义消解,TP391.1
- B2C市场中价格和价格离散的实证研究,F724.6
- 基于Hadoop的在线购物原型系统的设计与实现,TP311.52
- 苏州三值仪器有限公司的营销模式研究,F426.4
- 山东邮政电子商务发展战略研究,F616
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|