学位论文 > 优秀研究生学位论文题录展示
面向医保数据仓库的ETL技术研究与应用
作 者: 王月
导 师: 朱扬勇
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 数据仓库 ETL 元数据
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 112次
引 用: 0次
阅 读: 论文下载
内容摘要
医保基金风险防控平台本质是通过数据仓库面向主题的、集成的、与时间相关的、非可变等方面的特性来存储和管理从医保各业务子系统中采集来的高质量的、表达致的、规范化的数据,从而建立用于社会医疗保险基金风险评估的指标体系以及设计、实现违规行为检测、就医模式挖掘、统计分析测算等分析模型和算法,帮助医保业务分析人员系统地识别和规避医保基金管理过程中的各种风险。因此,医保数据仓库是医保基金管理和分析决策的重要基础,ETL和元数据管理正是建立数据仓库和保证数据质量最重要的技术。本文深入分析了医保基金风险防控平台数据仓库中的数据特点,包括数据来源、数据转换、加载目标以及中间过程中涉及到复杂医保业务的清洁和转换过程,继而引出医保数据仓库的ETL过程在技术实施上要解决的问题与困难。针对这些要点,深入研究了通过元数据驱动方式来实现ETL任务流的策略,特别是如何利用元数据来更有效地帮助用户进行ETL任务流的设计、验证、执行等,以及元数据存储库的设计和利用元数据为对数据仓库构建过程中数据链路中任何节点发生变更所带来影响进行定位于评估分析。本文的主要研究成果包括:1)利用元数据来描述ETL过程中各对象的结构模式,并基于公共仓库元模型的体系规范设计了适用于医保数据仓库架构的元数据存储方式和集成交换方案。2)设计了医保ETL过程活动步骤的核心数据结构并总结定义了医保ETL任务的基本转换操作集,通过继承复用该数据结构实现操作集中的转换操作。3)针对医保数据仓库维度缓慢变化的特点,提出了相应的医保增量数据更新的策略,特别是保留医保数据历史的方式;同时,对于医保数据仓库中现有的数据质量问题进行了研究和处理。4)基于这些理论研究,设计并实现了以元数据驱动的医保数据仓库ETL集成工具,能够减少在ETL任务设计过程中的错误,提高医保数据仓库的数据质量。同时通过在医保基金风险防控平台上的实践应用,成功完成了医保数据仓库参保人主题的ETL任务,验证了该解决方案在维护医保数据质量方面的可用性和有效性。
|
全文目录
相似论文
- 基于元数据的农田信息存储、管理和共享研究,S126
- 分面元数据在网站检索系统中的应用研究,G354.2
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 信息资源元数据模型的研究与应用,TP315
- 基于元数据的数据逻辑独立性方法研究,TP311.13
- 数据集市在电信经营分析中的应用研究,TP311.13
- 基于SaaS模式的科技信息资源托管平台设计与实现,TP393.09
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 家校互动教育平台中数据仓库的研究与应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 面向烟草制造行业的商务智能系统设计,TP311.13
- 政府产业经济决策支持系统研究,TP311.13
- 基于数据仓库的网络教研OLAP分析系统的设计与实现,TP311.13
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
- 社会保障体系中医疗保险的数据挖掘与联机分析研究,TP311.13
- 政府采购资金使用数据挖掘研究,TP311.13
- 基于数据仓库的器材保障综合管理系统的研究与设计,TP311.13
- 数据集中监管信息共享平台的设计与实现,TP311.52
- 数据挖掘在高职教学管理中的应用,TP311.13
- 基于WEB的电力工程造价信息数据库系统的设计与实现,F426.61
- 基于社团结构发现的数据仓库主题抽取的研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|