学位论文 > 优秀研究生学位论文题录展示

融合市场调研和数据挖掘的用户流失预警分析应用

作 者: 梁锐
导 师: 任江涛
学 校: 中山大学
专 业: 软件工程
关键词: 用户流失 市场调研 数据挖掘 非平衡数据集
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 49次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据挖掘技术发明以来,经过一段时间的快速发展,目前已经受到全世界范围内各行各业的关注,并形成了许多成功地将数据挖掘技术应用于生产的案例,改善了业务的发展,极大地提升了企业的竞争力。用户流失预警正是这样一个典型的数据挖掘应用,在电信行业经常被专家、学者提出来研究,已经积累了相当丰富的经验。本文以一个宽带用户流失预警专题分析任务为切入点,对数据挖掘技术在实践和应用过程将遭遇的问题展开分析和探讨。本文在展开过程中会引出另外一种应对用户流失问题的常用方法,即市场调研法,这是一种隶属于市场营销学科的方法,对业务问题的分析和解决有另外一套完整的方法体系,经过分析论证,市场调研与数据挖掘是一对可以进行优势互补的方法。本文将据此提出融入了市场调研概念的数据挖掘解决方案,使两者能够互补长短。另外,本文对于用户流失预警建模过程中存在的非平衡数据集的分类问题,会引入误分类代价参数的方法,并提供一种通过评估矩阵获取最佳参数配置的方法,避免训练过度的情况出现。接下来本文通过E市宽带用户流失预警专题分析的实际案例,对融入了市场调研概念的数据挖掘解决方案进行实践验证。本文的最后将进行总结,分析令案例成功实施的关键点,并展望该解决方案在其他业务问题,其他行业上的应用条件和前景。

全文目录


摘要  4-5
ABSTRACT  5-9
第一章 绪论  9-13
  1.1 项目研究背景和意义  9-11
  1.2 用户流失问题的研究成果  11-12
  1.3 本文的主要工作  12
  1.4 本文的组织结构  12-13
第二章 数据挖掘方法概述  13-22
  2.1 数据挖掘技术  13-14
    2.1.1 数据挖掘的定义  13
    2.1.2 数据挖掘的任务  13-14
    2.1.3 数据挖掘的步骤  14
  2.2 数据挖掘工具  14-17
    2.2.1 Clementine 软件介绍  14-15
    2.2.2 Clementine 集成的算法  15-17
  2.3 决策树算法 C5.0  17-22
    2.3.1 模型输出形式  18
    2.3.2 Boosting 技术  18
    2.3.3 Cross‐validate 技术  18-19
    2.3.4 非平衡数据集的分类问题  19-22
第三章 宽带用户流失专题解决方案  22-30
  3.1 引入市场调研的必要性  22-24
    3.1.1 数据挖掘存在的问题  22-23
    3.1.2 市场调研方法的特点  23-24
  3.2 融合的解决方案  24-30
    3.2.1 业务理解  25-26
    3.2.2 数据探索与预处理  26-27
    3.2.3 挖掘建模  27-28
    3.2.4 知识发现与运用  28
    3.2.5 整体评估  28-30
第四章 宽带用户流失专题实践  30-61
  4.1 业务理解  30-38
    4.1.1 业务所处地区概况  30-31
    4.1.2 业务表现  31-32
    4.1.3 业务目标  32-38
  4.2 数据探索与预处理  38-50
    4.2.1 确定数据探索方案  38-39
    4.2.2 业务系统数据收集  39-42
    4.2.3 市场调研数据收集  42-45
    4.2.4 数据探索  45-49
    4.2.5 数据预处理  49-50
  4.3 挖掘建模  50-55
    4.3.1 确定建模方案  50
    4.3.2 数据分区和选择  50-52
    4.3.3 建模与评估  52-54
    4.3.4 选择最优的模型  54-55
  4.4 知识发现与运用  55-58
    4.4.1 用户特征发现  55-57
    4.4.2 知识运用  57-58
  4.5 整体评估  58-61
    4.5.1 专题分析有效性评估  58-59
    4.5.2 业务效果评估  59-61
第五章 总结和展望  61-63
致谢  63-64
参考文献  64-66

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 糯米速冻食品发展前景分析,F426.82
  10. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  11. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  12. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  13. 基于行业参数优化模型的投资项目决策支持系统,F283
  14. 数据集市在电信经营分析中的应用研究,TP311.13
  15. 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
  16. 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
  17. 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
  18. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  19. 教学质量评估数据挖掘系统设计与开发,TP311.13
  20. 关联规则挖掘在交通事故成因分析中的应用,U491.31
  21. 关联规则算法在高职院校贫困生认定工作中的应用,G717

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com