学位论文 > 优秀研究生学位论文题录展示
基于Web使用挖掘的网站优化研究
作 者: 卢健
导 师: 葛世伦
学 校: 江苏科技大学
专 业: 管理科学与工程
关键词: 数据挖掘 Web使用挖掘 数据预处理 关联规则
分类号: TP393.092
类 型: 硕士论文
年 份: 2011年
下 载: 80次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,数据挖掘(Data Mining,简称DM),受到国际人工智能与数据库界的广泛重视。但是随着网络时代的到来,传统的数据挖掘的对象发生了改变,这对于数据挖掘和知识发现提出了新的挑战,Web挖掘正是这样的背景下提出的。Web挖掘就是从Web世界的各种数据中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的过程。Web挖掘已经成为Web信息决策的重要手段,而Web使用挖掘因为其获得挖掘数据的便利性及准确性,更是成为Web挖掘中的重要研究方向之一。目前我国的互联网已经十分普及,成为人们获取各种信息的主要手段之一。互联网与实体经济不断融合,利用互联网改造和提升传统产业,带动了传统产业结构调整和经济增长方式的转变,互联网已经成为我国发展低碳经济的新型战略性产业。工信部发布的互联网产业数据显示,截至2009年底,国内网站数量达到323万个,年增长率12.3%,网民人数达到4.04亿,信息产业占国内生产总值的比重达到10%左右。随着互联网产业的不断发展,网站之间的竞争达到了白热化程度,如何在日益激烈的网站竞争中脱颖而出是网站决策者面临的主要问题。“以用户为核心”的网站构建思想已经成为趋势。这就需要网站经营者了解用户对于网站访问的感受,同时根据用户的需要及时对于网站进行合理的改进,从而赢得用户的青睐。日志文件是网站能够直接获得的最为全面的用户访问记录,日志文件中记录了用户访问过程的全部信息。Web使用挖掘正是从Web日志文件中发现用户的访问习惯和访问模式,从而对于网站的运行布局和结构进行优化,进而提升网站的用户满意度。本文结合“江苏招生考试网”的真实运行数据,通过Web使用挖掘技术对于网站的运行日志文件进行全面的挖掘分析,从中发现用户的访问习惯和访问模式,进而发现网站的运行现状以及页面之间的关联性、时序性,最终根据挖掘结果帮助网站决策者制定优化策略,这对于网站适应未来发展趋势、加快自身发展、应对竞争和挑战有着极具价值的现实意义。论文创新之处主要体现于:全面梳理了Web使用挖掘的相关理论知识;针对Web使用挖掘的整个过程进行了深入探讨,特别针对数据预处理中的主要问题提出相应的解决办法;在理论研究的基础上,综合运用计算机技术、数据库技术、数据挖掘等手段,建立了“基于Web使用挖掘的网站优化系统”,为Web使用挖掘的实际应用做出了有益的尝试。
|
全文目录
摘要 6-7 Abstract 7-13 第1章 绪论 13-18 1.1 研究背景及意义 13-14 1.2 国内外研究现状 14-15 1.3 本文的研究内容 15-16 1.4 论文体系结构 16-17 1.5 论文创新点 17-18 第2章 数据挖掘与Web 使用挖掘 18-25 2.1 数据挖掘 18 2.2 Web 挖掘 18-19 2.3 Web 挖掘的分类 19-20 2.4 Web 使用挖掘 20-24 2.4.1 Web 使用挖掘的概念 20-21 2.4.2 Web 使用挖掘的应用 21-22 2.4.3 Web 使用挖掘的过程 22-23 2.4.4 Web 使用挖掘的常用概念 23-24 2.5 本章小结 24-25 第3章 Web 使用挖掘数据预处理研究 25-37 3.1 Web 使用挖掘数据源分析 25-27 3.1.1 Web 日志文件概述 25-26 3.1.2 Web 日志文件特点 26-27 3.2 数据预处理过程 27-28 3.3 数据融合与清理 28-30 3.4 用户识别 30-32 3.5 会话识别 32-33 3.6 路径完善 33-35 3.7 结果整合 35-36 3.8 本章小结 36-37 第4章 Web 使用挖掘的模式分析 37-47 4.1 访问者分析 37-38 4.2 关联性分析 38-42 4.2.1 关联规则的提出 38 4.2.2 关联规则的基本概念 38-39 4.2.3 关联规则的算法 39-41 4.2.4 关联规则挖掘的数据格式 41-42 4.3 时序性分析 42-44 4.3.1 时序性规则的概念 42 4.3.2 时序性规则的算法 42-44 4.4 基于权重的模式分析改进 44-46 4.4.1 页面权重 44-45 4.4.2 访问序列权重 45-46 4.5 本章小结 46-47 第5章 基于 Web 使用挖掘的网站优化系统设计 47-64 5.1 系统设计思想 47 5.2 系构结构 47-56 5.2.1 数据收集与处理模块 47-51 5.2.2 访问者分析模块 51-52 5.2.3 模式发现与分析模块 52-56 5.3 系统难点与解决方案 56-59 5.4 实验结果分析 59-63 5.5 本章小结 63-64 总结与展望 64-66 参考文献 66-69 附录1 数据预处理程序 69-81 附录2 用户识别数据库SQL 实现 81-83 附录3 会话识别数据库SQL 实现 83-85 攻读学位期间发表的学术论文 85-86 致谢 86
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com
|