学位论文 > 优秀研究生学位论文题录展示

四川省人口迁移状况的数据挖掘研究

作 者: 王灿
导 师: 张萍
学 校: 成都理工大学
专 业: 应用数学
关键词: 迁移人口 聚类分析 关联规则 数据挖掘
分类号: TP311.13
类 型: 硕士论文
年 份: 2012年
下 载: 77次
引 用: 1次
阅 读: 论文下载
 

内容摘要


人口问题一直是全社会最为关心的问题,人口的迁移与流动及其影响因素与管理方法是相关部门的管理工作者最棘手的问题。在以往的人口问题的研究中,已经出现了大量的相关的数据,但是在人口管理中这些数据多被管理者直接用来查询或者统计,而这些大量的数据中所隐含的我们最需要的或者说对我们最有用的信息却没有被我们发现。但是数据挖掘这门技术正好能解决上述问题,因为数据挖掘是在海量的并且没有直接规律的,这个过程的主要目的就是从大量的数据中挖掘出对我们最有价值的信息,而数据挖掘中的聚类及关联规则的挖掘及其应用是数据挖掘领域中非常重要和有价值的部分。因此本文在有关章节先介绍了数据挖掘的基本相关概念,并且着重探讨了数据挖掘中聚类方法及关联规则挖掘及其挖掘算法及实现。在第一部分内容中首先主要讨论了文章的研究背景与现状,通过讨论总结发现目前关于人口变动的研究多是关于流动人口或是青少年、老年等特殊年龄段的人口,鉴于更实际的需要,本文选择了地区变动人口为对象,但流动人口的去向性的调查并不能反映我们所要求的‘地区’这个对象,因此我们以地区这个不变点为基础,以迁移人口及净迁移差额率这些数据本身为目标展开研究,确定了具体的研究对象。在第二部分中,作者首先采取了GIS技术,以数据本身说话,把各个地市的净迁移差额率与经济因素的关系在地图上直观反应出来,力争做到简单明了,同时为下一步的研究奠定基础。在第三部分中,承接第二部分的内容,有了研究对象数据的直观变现和对此提出的问题,接下来的讨论就是对四川省21个地市对象的数据进行聚类,并选择了典型的中心距离聚类算法,在实现算法的工具选择上,考虑到在这部分内容中,21个对象不算太多的数据,如果选择复杂的算法或是使用大型的实现工具,取得的结果可能反而会不理想,因此作者大胆选择了方便快捷的SPSS工具。在第四部分中,以第一部分四川省各个地市迁移人口的净迁移差额率的分布的特征和结论为依托,以第二部分内容中的聚类为新的研究元素,在该部分内容中,把四川省各个地市的经济与非经济因素数据引入,选择经典的AP迭代算法,并使用Oracle数据库语言实现,探讨了使21个地市分属不同类别的关联因素,并对结果做出简要分析,提出相应的人口管理政策。

全文目录


摘要  4-6
Abstract  6-10
第1章 引言  10-14
  1.1 研究背景目的及意义  10-11
    1.1.1 研究背景  10-11
    1.1.2 研究意义  11
  1.2 国内外研究现状及评述  11-14
    1.2.1 国内外研究现状  11-12
    1.2.2 国内研究相关评述  12-14
第2章 四川省各地区迁移人口的分布状况  14-18
  2.1 迁移人口概念  14
  2.2 数据表现及分析  14-18
第3章 四川省各地区迁移人口的聚类  18-26
  3.1 数据挖掘简介  18-19
    3.1.1 数据挖掘的定义  18
    3.1.2 数据挖掘模式  18-19
  3.2 聚类过程  19-21
    3.2.1 基本概念  19-21
    3.2.2 聚类方法及选择  21
  3.3 算法实现  21-23
  3.4 过程及结果  23-26
    3.4.1 聚类过程  23-24
    3.4.2 聚类结果  24-26
第4章 四川省迁移人口的关联规则挖掘研究  26-40
  4.1 基本约定  26-29
    4.1.1 关联规则的类别  28
    4.1.2 关联规则挖掘过程  28-29
  4.2 关联规则挖掘算法  29-30
    4.2.1 Apriori 算法简述  29
    4.2.2 Apriori 算法实现  29-30
  4.3 数据解释  30-33
    4.3.1 数据采集  30-32
    4.3.2 数据预处理  32
    4.3.3 数据处理过程及结果  32-33
  4.4 规则关联挖掘过程  33-40
    4.4.1 数据表格的建立及说明  33-35
    4.4.2 挖掘过程及实现  35-40
结论  40-43
致谢  43-44
参考文献  44-46
攻读学位期间取得学术成果  46

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. 大学生综合素质测评研究,G645.5
  5. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  6. 南通市农业面源污染负荷研究与综合评价,X592
  7. 土壤环境功能区划研究,X321
  8. Bicluster数据分析软件设计与实现,TP311.52
  9. 基于变异粒子群的聚类算法研究,TP18
  10. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  11. 基于遗传算法和粗糙集的聚类算法研究,TP18
  12. 基于数据挖掘的税务稽查选案研究,F812.42
  13. 基于多因素模糊聚类的底板突水危险性预测研究,TD745
  14. 数据集市在电信经营分析中的应用研究,TP311.13
  15. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  16. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  17. 政府采购资金使用数据挖掘研究,TP311.13
  18. 基金投资绩效评估的实证分析,F832.51
  19. 基于云计算的Web教育爬虫,TP391.3
  20. Web点击流数据的聚类技术研究,TP311.13
  21. 数据挖掘技术在预防电信客户流失中的应用研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com