学位论文 > 优秀研究生学位论文题录展示

基于k-means的改进聚类融合算法的研究与应用

作 者: 刘雄
导 师: 刘曼玲
学 校: 中南大学
专 业: 计算机科学与技术
关键词: 聚类分析 聚类融合 差异度 差异比较函数 加权函数 k-means算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 110次
引 用: 0次
阅 读: 论文下载
 

内容摘要


聚类融合方法作为实现数据挖掘的探索性功能中最为重要的技术之一,已逐渐成为人们研究的热点,在电信、银行和金融信息量巨大的领域里得到了广泛的应用。随着通信技术的快速发展,各大运营商已经进入了全新的3G业务运行时代,如何在运营中了解客户的需求,提高对不同行为客户的服务是各大运营商成功的关键。运用数据挖掘技术中的聚类算法可以掌握用户信息,为人们提供高质量的服务。本文分析和研究了近年来国内外有关聚类算法和聚类融合算法的学术文献,针对单一算法只适合特定的数据和应用中的不足,提出一种基于k-means的改进聚类融合算法。该算法首先定义新的聚类成员的差异比较函数(Difference Comparison Function, DCF),并利用DCF对聚类成员进行评判,选择平均差异度较小的作为最终融合的成员;然后提出新的加权函数对聚类成员进行加权;最后利用共识矩阵进行融合。实验结果表明:改进的新方法能有效处理聚类成员的差异度,在聚类结果的准确性、可扩展性和鲁棒性方面比单一聚类算法有更好的表现。本文将改进的聚类融合算法应用于某通信运营商客户行为分析中,通过对客户的消费行为、客户对产品的使用频率等进行研究,了解客户的行为偏好,得到对该运营商客户行为分析管理有帮助的信息,真实的数据实验证明了该算法的有效性。

全文目录


摘要  3-4
ABSTRACT  4-5
目录  5-7
第一章 绪论  7-12
  1.1 研究背景  7-8
  1.2 研究的目的与意义  8-9
  1.3 国内外研究现状  9-10
  1.4 研究内容  10-11
  1.5 论文结构  11-12
第二章 聚类分析聚类融合研究  12-27
  2.1 聚类分析算法  12-21
    2.1.1 聚类和聚类分析  12-13
    2.1.2 聚类分析算法研究  13-21
  2.2 聚类融合算法研究  21-23
  2.3 聚类融合算法中差异度的研究  23-26
  2.4 小结  26-27
第三章 基于K-MEANS的改进聚类融合算法  27-46
  3.1 算法思想  27-29
    3.1.1 聚类融合算法存在的问题  27
    3.1.2 算法改进思路  27-29
  3.2 改进算法中相关定义  29-32
    3.2.1 聚类成员差异度定义  29-31
    3.2.2 加权函数定义  31-32
  3.3 算法描述  32-39
  3.4 实验分析  39-45
  3.5 本章小结  45-46
第四章 基于K-MEANS的改进聚类融合算法在客户细分中的分析  46-58
  4.1 市场分析  46
  4.2 客户细分  46-50
    4.2.1 客户细分的作用  46-48
    4.2.2 客户细分方法及存在的问题  48-50
  4.3 改进聚类融合算法在客户细分中的分析  50-57
    4.3.1 某通信运营商客户细分模型  50
    4.3.2 需求分析  50-52
    4.3.3 数据处理  52
    4.3.4 基于k-means的改进聚类融合算法在客户细分中的实验分析  52-54
    4.3.5 聚类结果分析  54-57
  4.4 本章小结  57-58
第五章 总结与展望  58-60
  5.1 总结  58
  5.2 展望  58-60
参考文献  60-65
附录  65-77
致谢  77

相似论文

  1. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  2. 高血压前期证候特征研究,R259
  3. 大学生综合素质测评研究,G645.5
  4. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  5. 21个荷花品种遗传多样性的ISSR分析,S682.32
  6. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  7. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  8. 南通市农业面源污染负荷研究与综合评价,X592
  9. 土壤环境功能区划研究,X321
  10. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  11. 大豆杂种优势及其遗传基础研究,S565.1
  12. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  13. K-means聚类优化算法的研究,TP311.13
  14. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  15. 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
  16. 云南省直管县改革研究,D630
  17. 基于分治法的聚类方法研究,TP311.13
  18. 三十种中成药元素含量分析及基于元素含量的中成药分类研究,R286.0
  19. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  20. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  21. 重庆文化产业竞争力研究,F224

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com