学位论文 > 优秀研究生学位论文题录展示

基于WEB日志挖掘的用户兴趣模式研究

作 者: 崔江彦
导 师: 马静
学 校: 南京航空航天大学
专 业: 管理科学与工程
关键词: 电子商务 Web日志挖掘 兴趣度 权值离散化 模糊聚类
分类号: TP393.092
类 型: 硕士论文
年 份: 2010年
下 载: 189次
引 用: 1次
阅 读: 论文下载
 

内容摘要


互联网的发展催生了全新的商业模式——电子商务,由于电子商务企业的竞争只在于鼠标的点击之间,因此如何获取并维持更多的网络用户成为了各电子商务企业之间竞争的焦点。对于电子商务网站能做的就是更加深入地了解用户的兴趣,而数据来源就是Web服务器日志。通过对Web日志进行分析和研究可以找到用户感兴趣的内容从而为用户提供个性化服务;同时对网站商品进行关联分析可以找出潜在的存在关联关系的商品,从而进行“捆绑式”销售;还可以根据页面聚类分析为网站的结构调整提供依据。本文主要是针对收集的Web服务器日志数据进行分析,找到一种新的用户对所访问Web页面的兴趣度量方法,在此基础上建立一个页面兴趣矩阵,然后通过对页面兴趣矩阵进行聚类分析,得到页面聚类和用户聚类进而为网站设计提供可行的参考。由于Web日志数据通常是大量和冗余的,日志中的页面之间关系又是模糊和不确定的,为此,本文采用模糊聚类方法进行Web日志的分析研究,主要工作如下:(1)概述了Web日志挖掘的发展和技术及其理论基础。(2)在深入研究Web日志预处理技术的基础上,通过对Web日志数据进行数据分析,提出一个新的页面兴趣度量方法。(3)提出了一个二次权值离散化的模糊聚类算法,在模糊聚类的基础上改进权值,提高了页面与页面(用户与用户)之间的关联度,文中对算法具体操作作了详细的描述,并辅以实例计算。(4)在上述工作的基础上,同时结合各种关键技术,设计了一个Web日志挖掘系统,主要功能包括数据导入,数据清洗,关键词Top10图表显示以及页面聚类和用户聚类等功能,为网站结构调整提供可行的参考。

全文目录


摘要  4-5
Abstract  5-9
第一章 绪论  9-14
  1.1 研究的背景和意义  9
  1.2 国内外研究现状  9-12
    1.2.1 国外研究现状  9-11
    1.2.2 国内研究现状  11-12
  1.3 本文的主要研究方法和组织结构  12-14
    1.3.1 本文的研究方法  12
    1.3.2 本文的组织结构  12-14
第二章 Web 挖掘与Web 日志挖掘研究  14-22
  2.1 Web 挖掘  14-15
    2.1.1 Web 挖掘的概述  14
    2.1.2 Web 挖掘的特点  14
    2.1.3 Web 挖掘的分类  14-15
  2.2 Web 日志挖掘的定义和基本概念  15-16
    2.2.1 Web 日志挖掘的定义  16
    2.2.2 Web 日志挖掘常用基本概念  16
  2.3 Web 日志内容  16-19
    2.3.1 Web 日志分布  16-17
    2.3.2 Web 日志的获取  17-18
    2.3.3 Web 日志的格式  18-19
  2.4 Web 日志挖掘过程  19-22
    2.4.1 Web 日志挖掘过程  19-20
    2.4.2 数据预处理技术  20-22
第三章 Web 日志挖掘的页面兴趣度量方法研究  22-29
  3.1 理论基础和相关定义  22-23
    3.1.1 理论基础  22
    3.1.2 相关定义  22-23
  3.2 新的页面兴趣度量方法  23-28
    3.2.1 页面兴趣度量常用方法  24-25
    3.2.2 新的页面兴趣度量方法  25-28
  3.3 本章小结  28-29
第四章 基于模糊聚类用户兴趣度计算  29-39
  4.1 日志聚类概述  29-31
    4.1.1 日志聚类概述  29-30
    4.1.2 常用的聚类方法  30-31
  4.2 二次权值离散化的模糊聚类算法  31-32
    4.2.1 模糊集基础知识  31-32
    4.2.2 模糊聚类算法  32
  4.3 Web 页面模糊聚类算法  32-35
  4.4 实例分析  35-39
第五章 Web 日志挖掘系统设计与实现  39-54
  5.1 电子商务网站Web 日志分析  39-41
  5.2 Web 日志挖掘系统的设计  41-47
    5.2.1 Web 日志挖掘系统的设计  41
    5.2.2 Web 日志挖掘的系统结构  41-42
    5.2.3 登录模块  42-43
    5.2.4 主控模块  43
    5.2.5 数据导入模块  43-44
    5.2.6 数据清洗模块  44-46
    5.2.7 聚类模块  46
    5.2.8 关键词统计模块  46-47
  5.3 Web 日志挖掘系统的实现  47-53
    5.3.1 开发环境选择  47-48
    5.3.2 系统展示  48-53
  5.4 本章小结  53-54
第六章 总结与展望  54-55
  6.1 本文的工作和创新点  54
  6.2 进一步工作  54-55
参考文献  55-58
致谢  58-59
攻读硕士学位期间发表的论文  59-60
附录  60-63

相似论文

  1. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  2. 土壤环境功能区划研究,X321
  3. 服装网络营销顾客忠诚度的实证研究,F274
  4. 中等职业学校语文课业设计的思考与实践,G633.3
  5. 演化聚类算法及其应用研究,TP311.13
  6. 论《联合国国际货物销售合同公约》在适用范围上的新发展,D997.1
  7. 基于兴趣度的Web日志用户访问序列模式挖掘,TP311.13
  8. B2C市场中价格和价格离散的实证研究,F724.6
  9. 基于Hadoop的在线购物原型系统的设计与实现,TP311.52
  10. 山东邮政电子商务发展战略研究,F616
  11. 几个电子现金支付方案的分析与改进,TP393.08
  12. 关于设立上海电子商务银行的可行性研究,F832.2
  13. 电子贸易全球化背景下的税收征管研究,F812.42
  14. 电子商务系统开发运用法律问题探讨,D923.6
  15. 在线相册冲印系统的设计与实现,TP311.52
  16. 龙城电子商城购物系统的设计与实现,TP311.52
  17. 基于Google平台促销模块与商品模块的设计与实现,TP311.52
  18. 支持精细化营销的B2C平台的设计与开发,TP311.52
  19. 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
  20. 网络音像交易平台设计与实现,TP393.09
  21. 电子商务技术扩散水平影响因素实证研究,F224

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com