学位论文 > 优秀研究生学位论文题录展示

基于Web日志的用户访问模式挖掘的研究

作 者: 夏聪
导 师: 孙玲芳
学 校: 江苏科技大学
专 业: 管理科学与工程
关键词: Web使用挖掘 Web日志 关联规则 用户聚类 行为模式
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 36次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络和信息技术的高速发展,基于Web的应用已经覆盖社会生活的各个方面,因此Web上的数据通常是海量的。在这些数据中,相比网页结构和内容,用户的使用模式更加引人关注。通过获取用户的访问模式,可以实现从优化网站设计到改善客户关系的一系列应用:根据访问者的行为模式来设计和修改网站结构和布局,让用户以最短的时间访问到感兴趣的页面,优化服务性能;理解和分析用户的浏览行为,发现潜在的用户并使用户驻留;通过对用户访问行为的把握,组织决策者可以更有针对性地设计商品目录,提高商业决策的准确性;发现个体用户的访问模式,从而识别出用户的兴趣、爱好、习惯和需求,建立个性化用户模型,为用户提供更个性化的内容和服务。用户使用模式的信息通常在Web服务器日志中有所体现。Web服务器日志记录了用户与服务器的交互信息,反映了用户访问Web站点的所有动作。对Web日志进行分析挖掘,获得用户访问行为的模式和兴趣爱好等有用信息,从而可以理解用户的访问行为。本文基于Web使用挖掘的方法和过程,将Web服务器日志文件作为数据源,旨在挖掘出单个用户以及群体用户的频繁访问路径,以发现网站用户的访问模式。针对单个用户的频繁访问路径挖掘,在详细介绍两种具有代表性的关联规则挖掘算法的基础上,从提高关联规则有用性的角度,引入有趣度测量因子实现对算法的改进;针对群体用户,在详细分析用户聚类的过程后,采用基于浏览路径的聚类算法实现对群体用户访问模式的发现。最后提出一个用户访问模式挖掘系统的模型框架,介绍各模块的功能并进行了实验分析,结合具体的实例数据加以说明。

全文目录


摘要  6-7
Abstract  7-12
第1章 绪论  12-19
  1.1 课题研究的背景及意义  12-14
    1.1.1 课题研究的背景  12-13
    1.1.2 课题研究的意义  13-14
  1.2 国内外研究现状  14-16
    1.2.1 数据预处理的国内外研究现状  14
    1.2.2 模式发现的国内外研究现状  14-15
    1.2.3 模式分析的国内外研究现状  15-16
  1.3 论文的主要研究内容  16-17
  1.4 论文的组织结构  17
  1.5 本章小结  17-19
第2章 数据预处理  19-31
  2.1 Web 使用挖掘概述  19-22
    2.1.1 Web 使用挖掘的概念和应用  19-20
    2.1.2 Web 日志的内容  20-22
    2.1.3 Web 使用挖掘的过程  22
  2.2 数据预处理  22-30
    2.2.1 数据清洗  23-25
    2.2.2 用户识别  25-26
    2.2.3 会话识别  26-27
    2.2.4 路径补充  27-28
    2.2.5 事务识别  28-30
  2.3 本章小结  30-31
第3章 基于关联规则的用户频繁访问模式挖掘  31-47
  3.1 用户频繁访问模式  31
  3.2 关联规则概述  31-33
    3.2.1 关联规则的概念和形式定义  31-33
    3.2.2 支持度  33
    3.2.3 置信度  33
  3.3 关联规则挖掘算法  33-39
    3.3.1 Apriori 算法  34-35
    3.3.2 对Apriori 算法经典改进的介绍  35-36
    3.3.3 FP 增长算法  36-39
  3.4 基于有趣度的改进的关联规则挖掘算法  39-46
    3.4.1 已有的有趣度定义  40
    3.4.2 本文提出的有趣度定义  40-41
    3.4.3 改进的算法  41-43
    3.4.4 实验结果  43-44
    3.4.5 实例分析  44-46
  3.5 本章小结  46-47
第4章 基于聚类分析的群体用户访问模式发现  47-59
  4.1 聚类  47-49
    4.1.1 聚类的类型  47-48
    4.1.2 聚类的应用  48-49
  4.2 页面聚类  49-50
  4.3 用户聚类  50-58
    4.3.1 用户特征选取  52-53
    4.3.2 用户相似度计算  53-55
    4.3.3 基于用户浏览路径的聚类  55-58
  4.4 本章小结  58-59
第5章 Web 用户访问模式挖掘系统  59-69
  5.1 系统总体结构  59
  5.2 系统各模块分析  59-68
    5.2.1 数据预处理模块  60-64
    5.2.2 用户频繁访问路径挖掘模块  64-66
    5.2.3 用户聚类模块  66
    5.2.4 模式分析与应用模块  66-68
  5.3 本章小结  68-69
结论  69-71
  论文工作总结  69
  研究展望  69-71
参考文献  71-74
攻读硕士学位期间发表的学术论文  74-75
致谢  75-76
大摘要  76-80

相似论文

  1. 基于行为模式的小区公共家具用户需求研究,F426.88
  2. 基于数据挖掘的税务稽查选案研究,F812.42
  3. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  4. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  5. 基于兴趣度的Web日志用户访问序列模式挖掘,TP311.13
  6. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  7. 基于关联规则的结构化浏览技术及其应用,TP391.41
  8. 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
  9. 通信行为指纹研究,TP311.13
  10. 动态关联规则的研究,TP311.13
  11. 高速网络环境下的入侵检测系统的研究,TP393.08
  12. 基于日志分析的超级计算机错误预测方法研究,TP338
  13. 低碳建设伙伴关系行为模式研究,F301.3;F205
  14. 数据挖掘在学生评价系统中的应用,TP311.13
  15. 基于模糊理论的Web用户聚类的研究,TP311.13
  16. 面向隐私保护的关联规则挖掘研究,TP311.13
  17. 基于Web日志的入侵检测系统设计与实现,TP393.08
  18. 用户交易行为的分析与展示—在现代易货业中的应用,TP311.13
  19. 基于关联规则和图排序的句子情感倾向性研究,TP391.1
  20. 基于数据挖掘的入侵检测技术的研究,TP393.08
  21. 关联规则算法及其在智能药房系统中的应用研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com