学位论文 > 优秀研究生学位论文题录展示
基于Web日志的用户访问模式挖掘的研究
作 者: 夏聪
导 师: 孙玲芳
学 校: 江苏科技大学
专 业: 管理科学与工程
关键词: Web使用挖掘 Web日志 关联规则 用户聚类 行为模式
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 36次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络和信息技术的高速发展,基于Web的应用已经覆盖社会生活的各个方面,因此Web上的数据通常是海量的。在这些数据中,相比网页结构和内容,用户的使用模式更加引人关注。通过获取用户的访问模式,可以实现从优化网站设计到改善客户关系的一系列应用:根据访问者的行为模式来设计和修改网站结构和布局,让用户以最短的时间访问到感兴趣的页面,优化服务性能;理解和分析用户的浏览行为,发现潜在的用户并使用户驻留;通过对用户访问行为的把握,组织决策者可以更有针对性地设计商品目录,提高商业决策的准确性;发现个体用户的访问模式,从而识别出用户的兴趣、爱好、习惯和需求,建立个性化用户模型,为用户提供更个性化的内容和服务。用户使用模式的信息通常在Web服务器日志中有所体现。Web服务器日志记录了用户与服务器的交互信息,反映了用户访问Web站点的所有动作。对Web日志进行分析挖掘,获得用户访问行为的模式和兴趣爱好等有用信息,从而可以理解用户的访问行为。本文基于Web使用挖掘的方法和过程,将Web服务器日志文件作为数据源,旨在挖掘出单个用户以及群体用户的频繁访问路径,以发现网站用户的访问模式。针对单个用户的频繁访问路径挖掘,在详细介绍两种具有代表性的关联规则挖掘算法的基础上,从提高关联规则有用性的角度,引入有趣度测量因子实现对算法的改进;针对群体用户,在详细分析用户聚类的过程后,采用基于浏览路径的聚类算法实现对群体用户访问模式的发现。最后提出一个用户访问模式挖掘系统的模型框架,介绍各模块的功能并进行了实验分析,结合具体的实例数据加以说明。
|
全文目录
摘要 6-7 Abstract 7-12 第1章 绪论 12-19 1.1 课题研究的背景及意义 12-14 1.1.1 课题研究的背景 12-13 1.1.2 课题研究的意义 13-14 1.2 国内外研究现状 14-16 1.2.1 数据预处理的国内外研究现状 14 1.2.2 模式发现的国内外研究现状 14-15 1.2.3 模式分析的国内外研究现状 15-16 1.3 论文的主要研究内容 16-17 1.4 论文的组织结构 17 1.5 本章小结 17-19 第2章 数据预处理 19-31 2.1 Web 使用挖掘概述 19-22 2.1.1 Web 使用挖掘的概念和应用 19-20 2.1.2 Web 日志的内容 20-22 2.1.3 Web 使用挖掘的过程 22 2.2 数据预处理 22-30 2.2.1 数据清洗 23-25 2.2.2 用户识别 25-26 2.2.3 会话识别 26-27 2.2.4 路径补充 27-28 2.2.5 事务识别 28-30 2.3 本章小结 30-31 第3章 基于关联规则的用户频繁访问模式挖掘 31-47 3.1 用户频繁访问模式 31 3.2 关联规则概述 31-33 3.2.1 关联规则的概念和形式定义 31-33 3.2.2 支持度 33 3.2.3 置信度 33 3.3 关联规则挖掘算法 33-39 3.3.1 Apriori 算法 34-35 3.3.2 对Apriori 算法经典改进的介绍 35-36 3.3.3 FP 增长算法 36-39 3.4 基于有趣度的改进的关联规则挖掘算法 39-46 3.4.1 已有的有趣度定义 40 3.4.2 本文提出的有趣度定义 40-41 3.4.3 改进的算法 41-43 3.4.4 实验结果 43-44 3.4.5 实例分析 44-46 3.5 本章小结 46-47 第4章 基于聚类分析的群体用户访问模式发现 47-59 4.1 聚类 47-49 4.1.1 聚类的类型 47-48 4.1.2 聚类的应用 48-49 4.2 页面聚类 49-50 4.3 用户聚类 50-58 4.3.1 用户特征选取 52-53 4.3.2 用户相似度计算 53-55 4.3.3 基于用户浏览路径的聚类 55-58 4.4 本章小结 58-59 第5章 Web 用户访问模式挖掘系统 59-69 5.1 系统总体结构 59 5.2 系统各模块分析 59-68 5.2.1 数据预处理模块 60-64 5.2.2 用户频繁访问路径挖掘模块 64-66 5.2.3 用户聚类模块 66 5.2.4 模式分析与应用模块 66-68 5.3 本章小结 68-69 结论 69-71 论文工作总结 69 研究展望 69-71 参考文献 71-74 攻读硕士学位期间发表的学术论文 74-75 致谢 75-76 大摘要 76-80
|
相似论文
- 基于行为模式的小区公共家具用户需求研究,F426.88
- 基于数据挖掘的税务稽查选案研究,F812.42
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 基于兴趣度的Web日志用户访问序列模式挖掘,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 基于关联规则的结构化浏览技术及其应用,TP391.41
- 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
- 通信行为指纹研究,TP311.13
- 动态关联规则的研究,TP311.13
- 高速网络环境下的入侵检测系统的研究,TP393.08
- 基于日志分析的超级计算机错误预测方法研究,TP338
- 低碳建设伙伴关系行为模式研究,F301.3;F205
- 数据挖掘在学生评价系统中的应用,TP311.13
- 基于模糊理论的Web用户聚类的研究,TP311.13
- 面向隐私保护的关联规则挖掘研究,TP311.13
- 基于Web日志的入侵检测系统设计与实现,TP393.08
- 用户交易行为的分析与展示—在现代易货业中的应用,TP311.13
- 基于关联规则和图排序的句子情感倾向性研究,TP391.1
- 基于数据挖掘的入侵检测技术的研究,TP393.08
- 关联规则算法及其在智能药房系统中的应用研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|