学位论文 > 优秀研究生学位论文题录展示

Web数据挖掘在电子商务中的应用研究

作 者: 宋洪芳
导 师: 贾作皆
学 校: 山东科技大学
专 业: 计算机应用技术
关键词: 数据挖掘 Web挖掘 Web访问信息挖掘 电子商务 电子商务推荐系统 关联规则 路径分析 协同聚类
分类号: TP393.09
类 型: 硕士论文
年 份: 2005年
下 载: 1140次
引 用: 5次
阅 读: 论文下载
 

内容摘要


数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种全新的信息技术,它融合了数据库、人工智能以及统计学等多种学科的知识,试图从数据中提取出先前未知、有效和有用的知识。 随着Internet的迅速发展和普及,电子商务的发展越来越多地引起研究者们的关注,期望能够在这种新型的商务模式下,充分利用它的优点,获得更多的经济效益。Web已经成为企业开展电子商务的基础。数据挖掘的思想和方法应用到电子商务中,帮助电子商务的经营者从海量的信息中得到真正有价值的知识,以指导他们的决策。Web数据挖掘就是在这样的背景下与电子商务结合在一起的。 Web挖掘是传统数据挖掘技术在Web环境下的应用,是从Web上的数据(如Web日志、页面内容、页面之间的结构等)中发现用户的浏览模式或寻找相关的Web页面等。Web挖掘分为Web内容挖掘、Web结构挖掘和Web访问信息挖掘。其中,与电子商务最为紧密的是Web访问信息挖掘。 本论文针对Web访问信息挖掘进行了较深入的研究。通过对用户访问信息进行有效的数据挖掘,可以从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构,为用户提供个性化服务。本论文的主要工作表现在以下几个方面: 1.综述了数据挖掘的主要方法、常用技术以及挖掘过程;讨论了Web挖掘的定义、分类、流程、应用领域、研究方向以及当前面临的问题。 2.探讨了电子商务、电子商务推荐系统与个性化服务、电子商务中进行Web挖掘的数据源、获取的知识模式以及Web访问信息挖掘在电子商务活动中的应用。 3.探讨了对Web访问日志进行预处理的方法。通过预处理Web访问日志,删除对于Web挖掘没有价值的数据,识别出用户会话,形成用户会话的数据库:运用最大向前引用方法对用户会话进行分割,得到用户的事务数据库。 4.将关联规则挖掘技术运用到电子商务中用户访问模式的发现。传统的关联规则挖掘算法并不适合Web中的用户访问模式的挖掘,所以必须改进关联规则挖掘算法。本文针对Web访问信息挖掘的特点,通过改进Apriori算法,得到一种频繁路径挖掘算法。为了提高挖掘算法的有效性,提出了一种不需要生成候选集的快速频繁路径挖掘算法。频

全文目录


1 绪论  18-21
  1.1 研究背景  18-19
  1.2 论文研究的意义  19
  1.3 本文的工作  19-21
2 数据挖掘和Web数据挖掘  21-34
  2.1 数据挖掘  21-28
  2.2 Web数据挖掘  28-34
3 在电子商务中应用Web数据挖掘技术  34-47
  3.1 电子商务概述  34-36
  3.2 电子商务推荐系统简介  36-37
  3.3 电子商务推荐系统使用的主要技术  37-41
  3.4 电子商务推荐算法面临的主要挑战  41-42
  3.5 Web数据挖掘在电子商务中的应用  42-46
  3.6 小结  46-47
4 Web日志挖掘的数据预处理  47-57
  4.1 Web日志挖掘  47-49
  4.2 Web日志挖掘中的数据预处理技术  49-56
  4.3 小结  56-57
5 基于关联规则的用户浏览访问模式发现  57-67
  5.1 基于Apriori的频繁路径挖掘算法  57-61
  5.2 不需产生候选集的快速频繁路径挖掘算法  61-66
  5.3 本章小结  66-67
6 电子商务中个性化的实现  67-78
  6.1 电子商务中个性化推荐系统的结构  67-68
  6.2 在Web日志中挖掘中应用协同过滤技术  68-72
  6.3 电子商务中Web页面的个性化推荐  72-77
  6.4 本章小结  77-78
7 结论  78-79
致谢  79-80
参考文献  80-82

相似论文

  1. 基于信息论的特征加权和主题驱动协同聚类算法研究,TP18
  2. 大学生愤怒情绪、睡前思维控制与睡眠质量的关系研究,B842.6
  3. 基于GIS的城市消防辅助决策系统的设计与实现,TU998.1
  4. 唐山市地税系统纳税评估理论与实践研究,F812.42
  5. 区域物流对区域经济增长的影响作用研究,F127;F224
  6. 基于AM/FM/GIS的油气管线管理系统的设计与实现,TE973
  7. 模糊聚类新算法及应用研究,TP311.13
  8. BSC及其在我国商业银行中的应用研究,F832.33
  9. 高校科技投入产出模型及其方法研究,F124.3
  10. C_(36)O和C_(60)O各异构体之间的转化以及C_(36)两种异构体(D_(2d,)D_(6h))之间的Stone-Wales翻转的理论研究,O613.71
  11. 耕作和有机物质投入对土壤碳库和团聚体稳定性的影响,S158
  12. 企业员工工作压力量表初步编制及其结构探索,B841
  13. 服务营销及其在城市商业银行的应用研究,F832.3
  14. 提升民营企业竞争力的路径分析,F276.5
  15. 中学生学习归因、学习自我效能感、学习策略和学业成就关系的研究,G442
  16. 公路地理信息系统的研究与实现,U495
  17. 全面质量管理和企业绩效的关系研究,F224
  18. 水利水电工程施工中的空间分析模型研究及应用,TV512
  19. 代谢网络通量和结构分析,Q591
  20. 基于GML/SVG的WebGIS试验模型,P208

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com