学位论文 > 优秀研究生学位论文题录展示

Web使用挖掘与网页个性化服务推荐研究

作 者: 王勇
导 师: 刘建平
学 校: 浙江理工大学
专 业: 计算机应用技术
关键词: 数据挖掘 Web使用挖掘 个性化推荐 Apriori算法 K-means算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 64次
引 用: 1次
阅 读: 论文下载
 

内容摘要


数据挖掘是计算机科学、人工智能和数据库研究方向的一项重要课题,它是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web页面包含复杂的、无结构的、动态的数据信息,如何对Web上的海量信息进行分析,针对用户的需求,提供个性化推荐服务,是当今数据挖掘技术一项重要的应用。本文在总结前人研究成果的基础上,针对Web使用挖掘进行了研究,主要内容归纳如下:(1)对数据挖掘的基本理论知识和分类进行了总体研究,详细分析了Web使用挖掘的数据源,数据预处理的基本流程。(2)对关联规则相关理论进行了详细的介绍,分析了经典Apriori算法的性能,对其进行了改进。在自然连接产生候选集以前先进行一个修剪过程,减少参加连接的项集数量,因而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数。(3)详细的介绍了K-means聚类算法的基本思想以及流程,分析了它的优缺点,提出了一种改进的K-means算法,即MFA算法。针对K-means算法中每次调整簇中心后确定新的簇中心需要大量的距离计算,提出一种利用簇中心的变化信息来确定新簇中心的方法,通过从动态簇中心集中选取候选集的方法减少了过滤算法的计算复杂度。(4)对校园网网站的日志数据进行分析处理,利用改进的挖掘算法进行数据挖掘,发现用户的访问模式,最后利用挖掘结果,给网站添加个性化推荐功能,主动为用户推荐其可能感兴趣的信息。

全文目录


相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. K-means聚类优化算法的研究,TP311.13
  7. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  8. 基于遗传算法和粗糙集的聚类算法研究,TP18
  9. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  10. 教学质量评估数据挖掘系统设计与开发,TP311.13
  11. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  12. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  13. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  14. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  15. 高校毕业生就业状况监测系统研究,G647.38
  16. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  17. 基于关联规则的结构化浏览技术及其应用,TP391.41
  18. 面向用户偏好的MADM方法在个性化推荐中的应用,G353.1
  19. 基于数据挖掘的信用卡客户激活与响应度研究,F832.2
  20. 银行个人客户关系管理系统的设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com