学位论文 > 优秀研究生学位论文题录展示
基于数据挖掘的客户流失预测实证研究
作 者: 司学峰
导 师: 蒋国瑞
学 校: 北京工业大学
专 业: 管理科学与工程
关键词: 数据挖掘 客户流失预测 非平衡数据 代价敏感学习 支持向量机
分类号: F224
类 型: 硕士论文
年 份: 2009年
下 载: 388次
引 用: 2次
阅 读: 论文下载
内容摘要
现实世界中,数据的分布往往是不平衡的,数据非平衡性问题已影响到多个应用领域如:客户流失、欺诈侦测、风险管理等。当前,随着数据挖掘研究的深入,非平衡数据挖掘正成为一个新的热点研究领域。本文研究的客户流失数据集具有典型的非平衡数据问题,客户流失对象为网络招聘行业的企业客户。全球网络招聘方兴未艾,据统计全球每天约有2000万条就业信息发布,3000多万人在互联网上发出求职简历,2006年全球招聘市场规模为172亿美元。在中国,2007年网络招聘市场规模为9.7亿元,2008年12.5亿,预计2009年将达到16.1亿元。网络招聘巨大的市场规模,良好的利润前景催生了新的专业化、行业性、地方性的招聘网站的诞生,同时也加剧了网络招聘行业的激烈竞争。针对客户流失问题,目前在电信行业、银行业、保险行业基于数据挖掘技术进行客户流失预测建模,并取得了丰硕的研究成果。而针对网络招聘行业面向企业客户流失问题的研究尚属起步阶段,本文分析了前人研究成果,对非平衡数据进行了介绍;对客户流失预测理论、研究方法和发展脉络进行了回顾与综述;支持向量机(Support Vector Machine,SVM)以其坚实的理论基础与良好的推广性能成为近几年来应用研究的热点,是一种流行的数据挖掘技术,本文对支持向量机进行了介绍;论述了我国网络招聘行业特征、市场规模及发展前景。最后通过国内某知名招聘网站企业客户特征数据以及客户在线行为日志数据,利用数据挖掘技术进行了客户流失预测建模及挽留策略的实证研究。本文的研究成果主要有:1)针对客户流失数据集的非平衡性与错分代价差异性问题,在传统SVM基础上,引入代价敏感学习理论,提出了代价敏感SVM的客户流失预测建模方法,通过实验验证了方法的有效性,对解决此类问题有一定的借鉴意义。2)针对客户流失预测数据集的高维特征约减问题,提出了主成分分析与神经网络的预测建模方法。通过实证研究,结果表明此组合方法降低了高维属性,简化了神经网络拓扑结构,提高了模型的预测性能。3)针对网络招聘企业客户挽留问题,分析了客户流失影响因素,基于K-means聚类技术对客户在线行为进行客户细分,并结合每类客户特征探讨了客户关系管理策略。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-21 1.1 研究背景及意义 9-11 1.1.1 研究背景 9-10 1.1.2 研究意义 10-11 1.2 国内外研究现状 11-16 1.2.1 客户流失因素分析研究现状 11-13 1.2.2 基于数据挖掘的客户流失预测研究现状 13-16 1.3 研究内容与创新点 16-17 1.4 研究内容图析 17-19 1.5 本章小结 19-21 第2章 相关理论研究 21-39 2.1 数据挖掘 21-24 2.1.1 数据挖掘概念 21 2.1.2 数据挖掘功能 21-22 2.1.3 数据挖掘流程 22-24 2.2 统计学习理论与支持向量机 24-35 2.2.1 机器学习 24-25 2.2.2 统计学习理论 25-27 2.2.3 支持向量机 27-33 2.2.4 支持向量机研究现状 33-35 2.3 神经网络与聚类分析 35-38 2.3.1 神经网络 35-37 2.3.2 K-means聚类原理 37-38 2.4 本章小结 38-39 第3章 基于代价敏感SVM的客户流失预测实证研究 39-51 3.1 研究背景 39-43 3.1.1 网络招聘 39-40 3.1.2 行业现状 40-41 3.1.3 案例背景 41-43 3.2 代价敏感学习 43-44 3.3 不同惩罚系数SVM 44-45 3.4 代价敏感SVM 45-46 3.5 预测建模 46-47 3.5.1 数据选择 46-47 3.5.2 数据预处理 47 3.5.3 数据建模 47 3.6 结果分析 47-50 3.7 本章小结 50-51 第4章 基于PCA与神经网络的客户流失预测实证研究 51-59 4.1 主成分分析原理 51-52 4.2 数据挖掘工具 52-54 4.3 流失预测建模 54-56 4.4 结果分析 56-57 4.5 本章小结 57-59 第5章 基于聚类技术的企业客户在线行为细分研究 59-67 5.1 网络招聘企业客户流失因素分析 59-60 5.2 客户流失预测收益分析 60-61 5.3 基于k-means技术的客户细分 61-65 5.4 结果分析 65-66 5.5 本章小结 66-67 结论与展望 67-69 参考文献 69-72 硕士研究生期间的研究成果 72-73 致谢 73
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于车载3D加速传感器的路况监测研究,TP274
中图分类: > 经济 > 经济计划与管理 > 经济计算、经济数学方法 > 经济数学方法
© 2012 www.xueweilunwen.com
|