学位论文 > 优秀研究生学位论文题录展示

数据挖掘在保险客户数据中的应用研究

作 者: 王智平
导 师: 傅铁威
学 校: 昆明理工大学
专 业: 计算机系统结构
关键词: 数据挖掘 WEKA 聚类分析 K-means 决策树 C4.5 Apriori算法 保险客户数据
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 24次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着当今信息技术在中国的快速发展,企业已经逐渐积累起来了海量数据,如何利用和分析这些数据,成为摆在企业面前的一个难题?此时,数据挖掘的应用则应运而生。现今,数据挖掘在各个方面影响着企业的经营与决策,基于数据挖掘的数据分析工具和平台在企业中的应用也逐渐普及。近几年来,随着国内各保险企业的新产品的不断推出和外资保险公司的进入,我国保险企业面临的市场竞争变得日益激烈,为了降低企业营销成本,提高保险公司客户响应率,解决传统撒网式营销的问题,利用数据挖掘技术来分析保险公司多年来积累的海量数据,挖掘出其内在的信息和商机,从而及时准确的了解和把握市场,提高产品的市场占有率,这对保险企业的发展具有十分重要的意义。本文研究课题是利用数据挖掘的相关算法与数据挖掘分析工具,结合某保险公司的客户数据对其进行分类与关联险种的挖掘,从而发现数据的特征,了解客户的购买行为习惯以及保险险种之间的相关关联。通过对保险客户消费行为的分析,来支持客户群体的定位和组合险种的推销,以便制定有针对性的营销方案,实现依据不同层次的客户采取不同的营销策略。本文详细阐述了数据挖掘技术在保险客户数据分析中的应用,所做的主要工作有:1.分析介绍了本课题的研究背景与当前的研究现状,以及数据挖掘在保险领域的应用。2.介绍了数据挖掘的相关理论技术,并对数据挖掘的相关技术和工具进行了对比与总结性综述。3.对本文采用的数据挖掘相关算法进行了详细介绍,并提出了K-Means的改进算法。4.运用数据挖掘相关的理论技术,结合保险客户数据进行需求分析、数据预处理过程分析,并提出了保险客户数据挖掘分析模型,给出了交叉销售分析模型和客户细分分类模型,并详细阐述了它们。5.结合聚类分析的经典K-Means算法与改进后的算法对保险客户训练集数据进行分析,给出了改进前后的算法分类结果准确性的比较。6.给出了保险客户数据险种进行关联分析后的结果。7.给出了保险客户数据部分加工表以及数据分类、数据加工规则。8.结合训练集数据,利用决策树分类中的C4.5算法进行分类规则的导出,并对测试集数据进行细分分类,对分类结果进行分析。依据Apriori关联算法,结合保险客户样本数据实例进行关联分析。9.对本文所做的主要工作进行了总结,并对所存在的问题进行了探讨,指出了未来工作和研究的方向。

全文目录


摘要  5-7
Abstract  7-12
第一章 引言  12-20
  1.1 课题研究背景  12-13
  1.2 国内外相关研究  13-15
    1.2.1 国外研究动态  13-14
    1.2.2 国内研究动态  14-15
  1.3 数据挖掘在保险领域中的应用  15-16
  1.4 研究意义  16-18
  1.5 论文组织结构  18-20
第二章 相关理论技术介绍  20-30
  2.1 数据挖掘简介  20-22
  2.2 数据挖掘流程  22-24
    2.2.1 定义问题  22-23
    2.2.2 数据预处理  23
    2.2.3 数据挖掘  23-24
    2.2.4 结果分析  24
  2.3 数据挖掘技术  24-25
  2.4 数据挖掘分类  25-26
  2.5 数据挖掘工具  26-29
  2.6 本章小结  29-30
第三章 聚类分析算法、分类分析算法和关联规则算法研究  30-44
  3.1 聚类分析介绍  30-31
  3.2 K-means算法及其改进  31-35
  3.3 分类分析介绍  35-36
  3.4 决策树C4.5分类算法  36-38
  3.5 关联规则介绍  38-39
  3.6 Apriori算法  39-42
  3.7 本章小结  42-44
第四章 数据挖掘在保险客户数据中的分析  44-58
  4.1 商业理解分析  44-46
    4.1.1 数据来源  44
    4.1.2 精众电子行销平台  44-45
    4.1.3 消费能力模型  45-46
  4.2 挖掘任务可行性分析  46-47
    4.2.1 数据可行性  46
    4.2.2 挖掘工具可行性  46-47
  4.3 数据预处理过程  47-50
    4.3.1 数据清理与降维  47-50
    4.3.2 数据转换与规格化  50
  4.4 保险客户数据挖掘分析模型  50-52
    4.4.1 客户数据挖掘模型  50-52
    4.4.2 客户数据分析模型  52
  4.5 保险客户的数据分析  52-57
    4.5.1 K-means算法对训练集保险客户数据进行聚类  53-56
    4.5.2 保险客户数据关联分析  56-57
  4.6 本章小结  57-58
第五章 基于数据挖掘的保险客户数据应用研究  58-70
  5.1 客户数据挖掘模型建模  58-62
    5.1.1 数据准备  58-59
    5.1.2 数据加工  59-62
  5.2 WEKA工具环境构建  62-64
  5.3 决策树算法对数据进行预测分类及结果分析  64-66
    5.3.1 C4.5算法数据应用  64-65
    5.3.2 结果分析  65-66
  5.4 关联挖掘Apriori算法实例及结果分析  66-70
    5.4.1 Apriori算法数据应用  66-69
    5.4.2 结果分析  69-70
第六章 总结及展望  70-74
  6.1 论文工作总结  70-71
  6.2 未来工作展望  71-74
致谢  74-76
参考文献  76-80
附录1 攻读硕士学位期间所发表软著及实践情况  80

相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  3. 高血压前期证候特征研究,R259
  4. 基于数据挖掘技术的保健品营销研究,F426.72
  5. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  6. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  7. 大学生综合素质测评研究,G645.5
  8. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  9. 21个荷花品种遗传多样性的ISSR分析,S682.32
  10. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  11. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  12. 南通市农业面源污染负荷研究与综合评价,X592
  13. 土壤环境功能区划研究,X321
  14. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  15. 大豆杂种优势及其遗传基础研究,S565.1
  16. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  17. Bicluster数据分析软件设计与实现,TP311.52
  18. 基于变异粒子群的聚类算法研究,TP18
  19. K-means聚类优化算法的研究,TP311.13
  20. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  21. 基于遗传算法和粗糙集的聚类算法研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com