学位论文 > 优秀研究生学位论文题录展示

Web使用挖掘及其在网站优化中的应用

作 者: 田倩飞
导 师: 左源瑞
学 校: 西南大学
专 业: 农业机械化工程
关键词: Web使用挖掘 日志预处理 点击流数据仓库 序列聚类 网站优化
分类号: TP393.092
类 型: 硕士论文
年 份: 2009年
下 载: 182次
引 用: 3次
阅 读: 论文下载
 

内容摘要


Web使用挖掘的研究对象是Web日志数据。Web日志数据记录了用户对Web站点的访问信息,对这些信息进行分析可以发现用户访问站点的浏览模式和访问习惯,可帮助实现网页的预存取和缓存;对于页面重组、优化网站的结构等方面都具有十分重要的意义。本文对Web使用日志这些半结构化的数据进行预处理,结合实例网站的实际数据,创建了适合实例网站的点击流数据仓库模型,然后运用SQL 2005 AnalysisService中的Sequence Cluster模型进行数据挖掘,最后对数据挖掘结果进行数据分析,给网站的管理者提供网站结构优化的建议。论文所做的主要工作如下:1.对数据挖掘和Web使用挖掘的相关知识和技术进行了概述,阐述了Web使用挖掘的意义、研究现状以及面临的问题;2.讨论了Web使用挖掘的三个阶段:数据预处理、模式识别和模式分析,分析了Web使用挖掘的应用领域和研究方向;3.为数据预处理的数据采集、数据净化、用户识别和会话识别等部分提供了详细的算法。Web日志数据通过这些算法进行预处理后,为数据仓库的建立提供了可靠的准备数据。4.利用日志分析工具Deep Log Analyzer对经过预处理的日志数据进行分析,得到基本的统计数据及图表。接着分析建立点击流数据仓库的必要性。根据MarkSweiger等提供的标准点击流仓库模型,提出适合实例网站的数据仓库逻辑模型,并在此逻辑模型的基础上,建立相应的物理模型。5.最后将上述的数据预处理算法和数据仓库模型应用在实例网站的访问日志中,然后运用SQL Server 2005 Analysis Service中的Sequence Cluster模型分析数据仓库中的数据,并将分析结果应用于网站结构的调整。

全文目录


相似论文

  1. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  2. 基于Web使用挖掘的网站优化研究,TP393.092
  3. 基于Web日志的用户访问模式挖掘的研究,TP311.13
  4. 一种基于GWRN模型的自组织神经网络算法的研究及应用,TP393.05
  5. Web挖掘技术在远程教学系统中的应用,TP391.6
  6. 面向校园网日志分析的web数据挖掘技术研究,TP311.13
  7. 基于关联规则及序列模式的Web日志挖掘系统,TP311.13
  8. 点击流数据仓库在电子商务中的应用研究,TP311.13
  9. E-Learning平台上基于学习行为分析的个性化教学系统的研究与实现,TP391.6
  10. Web日志挖掘在优化教育站点的应用,TP393.09
  11. Q公司基于网络营销的网站优化改进策略研究,TP393.092
  12. 网络日志挖掘和协同过滤算法的研究,TP393.092
  13. Web使用挖掘中事务间关联规则方法研究,TP311.13
  14. 基于Web使用挖掘的浏览兴趣预测及个性化推荐策略研究,TP391.3
  15. 基于Web日志挖掘的网站优化技术与应用,TP393.092
  16. 基于K-均值聚类算法的Web日志挖掘技术的研究和应用,TP311.13
  17. 我国区域贸易开放度与经济增长收敛性研究,F752;F127
  18. 点击流数据仓库的模式设计及ETL技术的研究与实现,TP311.13
  19. Web日志挖掘技术研究,TP311.13
  20. 基于XML及关联规则的个性化推荐技术研究,TP311.13
  21. 基于Web使用挖掘的在线报名推荐系统的研究与实现,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com