学位论文 > 优秀研究生学位论文题录展示

地理编码引擎的设计与实现

作 者: 陈旭
导 师: 李青元
学 校: 辽宁工程技术大学
专 业: 地图制图学与地理信息工程
关键词: 地理编码 地址匹配 语义分析 空间数据 数据挖掘
分类号: P208
类 型: 硕士论文
年 份: 2009年
下 载: 95次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着地理信息系统在我国信息化建设中的不断应用,信息资源整合与共享的需求越来越高,而非空间信息与空间信息整合是资源整合的重要组成部分,并且已经提出从这些隐含位置信息的非空间数据中提取出空间定位信息的需求。当前互联网中存在着海量的隐含地理位置的文本信息,如何将其转换成空间数据呢?地理编码就是解决这些问题的有效方法。地理编码引擎可从网页文本中挖掘出具有地理信息语义的内容,并将其转换成具有定位信息的有效地理信息。因此,地理编码引擎的研究有着深远的意义和巨大的应用前景。本文针对中文地理编码问题,提出了基于语义的地名地址、邮政编码、手机号码和身份证号码的识别与匹配的方法,并在模糊地名匹配上做出探索,采用挖掘上下文潜在定位信息的方法,提高了地址别名和不完整地名的识别率。本文对比了中文分词的常见算法,设计了基于中文语义分析的隐含地理信息识别和匹配引擎,建立了面向地理实体的基础地理参考数据库,开发了引擎原型应用系统,进行了互联网灾情新闻自动标绘和互联网房屋租赁信息搜索与定位的应用试验,取得了良好的效果。

全文目录


致谢  5-7
摘要  7-8
Abstract  8-12
1 绪论  12-17
  1.1 研究背景和意义  12-13
  1.2 国内外理论研究现状  13
  1.3 国内外应用研究现状  13-15
  1.4 论文的主要研究工作与成果  15-16
  1.5 主要内容和论文组织  16-17
2 地理编码与可定位文本信息概述  17-21
  2.1 地理编码的概念  17-18
  2.2 地理编码的过程  18-19
  2.3 地理编码的应用模式  19-20
  2.4 地理编码引擎的概念  20
  2.5 具有定位信息的文本  20-21
3 地理编码引擎的设计原理与方法  21-37
  3.1 典型数据模型  21-25
    3.1.1 标准地名模型  21
    3.1.2 标准地址模型  21-24
    3.1.3 标准邮政编码模型  24
    3.1.4 标准手机号码模型  24-25
    3.1.5 标准身份证号码模型  25
  3.2 中文分词技术  25-32
    3.2.1 基于语言学知识的方法  25-31
    3.2.2 基于大规模语料库的机器学习方法  31-32
  3.3 地名地址标准化技术  32-33
  3.4 可定位信息的识别  33-34
    3.4.1 地名地址的识别  33
    3.4.2 邮政编码的识别  33
    3.4.3 手机号码的识别  33
    3.4.4 身份证号码的识别  33-34
  3.5 基础地理参考数据库  34-37
    3.5.1 面向地理实体的地理参考数据库  34-36
    3.5.2 地理参考数据库设计  36-37
4 地理编码引擎的设计与实现  37-48
  4.1 引擎设计目标  37
  4.2 引擎构架  37-42
    4.2.1 访问接口层  37
    4.2.2 地名地址标准化层  37-38
    4.2.3 坐标匹配与综合评价层  38
    4.2.4 基础地理参考数据库层  38-42
  4.3 引擎工作流程  42
  4.4 引擎的编程实现  42-48
    4.4.1 开发环境的选择  42-43
    4.4.2 引擎服务访问接口  43-44
    4.4.3 执行结果反馈格式  44-48
5 地理编码引擎的应用举例  48-56
  5.1 互联网灾情新闻地图标绘原型系统  48-52
    5.1.1 背景  48-49
    5.1.2 系统设计  49-50
    5.1.3 地理编码引擎的应用  50-51
    5.1.4 结果分析  51-52
  5.2 互联网房屋租赁信息搜索与定位原型系统  52-56
    5.2.1 背景  52
    5.2.2 系统设计  52-54
    5.2.3 地理编码引擎的应用  54-55
    5.2.4 结果分析  55-56
6 总结与展望  56-58
  6.1 总结  56
  6.2 进一步研究的内容  56-57
  6.3 展望  57-58
参考文献  58-60
作者简历  60
在学期间发表的学术论文  60-61
学位论文数据集  61-62

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  10. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  11. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  12. 基于GIS的矿井水灾害地球物理信息管理系统研究,TD745
  13. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  14. 教学质量评估数据挖掘系统设计与开发,TP311.13
  15. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  16. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  17. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  18. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  19. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  20. 高校毕业生就业状况监测系统研究,G647.38
  21. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13

中图分类: > 天文学、地球科学 > 测绘学 > 一般性问题 > 测绘数据库与信息系统
© 2012 www.xueweilunwen.com