学位论文 > 优秀研究生学位论文题录展示
基于知识的医学图像检索
作 者: 胡常军
导 师: 吴洪
学 校: 电子科技大学
专 业: 计算机软件与理论
关键词: 基于知识的医学图像检索 最大匹配模式 最小匹配模式 融合 概念向量空间模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 110次
引 用: 1次
阅 读: 论文下载
内容摘要
医学成像技术的发展促进了临床医学的进步,数字医学图像在辅助诊断、教学和生物医学研究领域发挥了日益增大的作用。与此同时,数字医学图像的数量也与日剧增,如何从这些海量的医学图像中找到需要的图像成为一个日益迫切的问题。但是,传统的基于关键字的图像检索方式和近年来兴起的基于内容的图像检索方式都不能很好地满足医学图像检索的需要,因此探索新的高效的医学图像检索方法非常必要。本文采用根据医学图像对应的文本信息来检索图像的方式,探索基于知识的医学图像检索方法。医学图像对应的文本有DICOM头部信息、医学报告、图像标注等,在这些文本中包含了对医学图像的描述。由于这些描述是自然语言形式的文字,比图像的低层特征更符合人的思维习惯、更贴近人对图像的理解,因此,使用医学图像对应的文本信息检索图像往往比使用低层特征检索图像更加有效。考虑到传统的基于关键字的文本检索方式存在着诸多问题,例如,同义词现象会降低检索的查全率,而一词多义现象导致低的查准度等等。本文采用基于知识的医学图像检索方法:根据医学本体从医学图像对应的文本中提取医学概念,然后用这些概念对医学图像进行元数据标注,这样就赋予了医学图像语义内涵,使检索从目前广泛采用的基于语法层面的关键字匹配上升到基于知识层面的概念匹配,从而很好地解决了同义词和一词多义等问题,并可以利用概念的上下位关系实现查询扩展,结合多语言词典实现跨语言检索。由于在一般的医学报告和文章中,对医学概念的描述通常形式多样,采用传统的概念提取方法往往不能准确、全面地提取出文本中的概念。针对这一问题,本文提出了一种新的医学概念提取方法,并基于该概念提取方法对医学图像的索引与检索以及整个检索框架的设计进行了探索性的研究工作。本文的主要贡献为:1.针对医学图像对应文本中存在的概念描述形式多样性的问题,提出了一个混合的医学概念提取方法。从知识理解的角度提出了医学概念提取的最大匹配模式;根据对医学词条构成特点的分析提出了医学概念提取的最小匹配模式,并详细探讨这两种模式各自的优点和缺陷,以及改善缺陷的方法和途径。指出将两种模式进行融合可以实现优势互补,提升医学图像检索的效果。2.在建立索引和进行检索时,将经典的基于词条的向量空间模型改造为基于概念的概念向量空间模型,使用TF-IDF策略对概念进行加权,使用余弦相似度来度量医学图像和查询之间的相似性。3.为了验证本文提出的方法,在ImageCLEFMed2009国际竞赛的基于图像的查询主题上进行了实验。实验结果表明融合两种概念提取模式以及在此基础上进行查询扩展是提高医学图像检索精度的有效方法。4.提出了一个集成上述方法的基于知识的医学图像检索通用框架,并基于该框架实现了一个基于知识的医学图像检索原型系统。这个系统采用组件化技术开发;具有高内聚和低耦合性、可扩展性强等特点,便于多种检索模式的融合,便于与其他检索系统集成;还可以将多个实例系统组成一个分布式检索体系;系统中各组件可以通过配置文件进行配置,而且配置参数可以在运行时进行调整。
|
全文目录
摘要 4-6 ABSTRACT 6-11 第一章 引言 11-19 1.1 课题研究的背景 11-12 1.2 研究的目的和意义 12 1.3 国内外研究现状 12-17 1.3.1 医学图像检索原理 12-16 1.3.2 相关研究进展 16-17 1.3.3 ImageCLEFMed 国际竞赛 17 1.4 本文研究的主要内容 17-18 1.5 本文组织 18-19 第二章 相关研究与理论基础 19-35 2.1 本体 19-22 2.1.1 本体的定义 19-20 2.1.2 本体的建模元语 20 2.1.3 构建本体的准则 20-21 2.1.4 本体的分类 21 2.1.5 本体的应用 21-22 2.2 医学本体的介绍与选择 22-27 2.2.1 FMA 23-24 2.2.2 RadLex 24 2.2.3 ICD 24 2.2.4 UMLS 24-27 2.3 检索方法 27-28 2.3.1 数据检索 27 2.3.2 全文检索 27 2.3.3 知识检索 27-28 2.4 检索模型 28-31 2.4.1 布尔模型 28-29 2.4.2 向量空间模型 29-30 2.4.3 概率模型 30 2.4.4 统计语言模型 30-31 2.5 信息抽取理论 31-34 2.5.1 信息抽取简介 31-32 2.5.2 信息抽取模型 32-34 2.6 本章小结 34-35 第三章 医学概念提取 35-53 3.1 医学文本特点 35-36 3.1.1 医学图像描述信息 35-36 3.1.2 用户查询样例 36 3.2 基于最大匹配模式的医学概念提取 36-42 3.2.1 最大匹配模式 36 3.2.2 MetaMap 简介 36-37 3.2.3 MetaMap 原理 37-38 3.2.4 概念提取 38-40 3.2.5 歧义问题 40-41 3.2.6 方法分析 41-42 3.3 基于最小匹配模式的医学概念提取 42-52 3.3.1 医学文本分析 42-44 3.3.2 最小匹配模式 44-45 3.3.3 Gate 简介 45-47 3.3.4 ANNIE 组件 47 3.3.5 概念提取 47-51 3.3.6 歧义问题 51 3.3.7 方法分析 51-52 3.4 本章小结 52-53 第四章 医学图像检索 53-69 4.1 基于知识的检索模型 53-58 4.1.1 基于OWL 的检索模型及其局限 53-54 4.1.2 概念向量空间模型 54-58 4.2 两种匹配模式的融合 58-59 4.3 查询扩展 59-60 4.4 基于知识的医学图像检索实验 60-67 4.4.1 实验数据 60-64 4.4.2 评测指标 64-65 4.4.3 实验安排 65-66 4.4.4 实验结果与分析 66-67 4.5 本章小结 67-69 第五章 基于知识的医学图像检索系统设计与实现 69-81 5.1 系统目标 69 5.2 系统设计 69-75 5.2.1 系统模块 69-70 5.2.2 检索模块设计 70-75 5.3 界面设计与运行实例 75-80 5.4 本章小结 80-81 第六章 总结与展望 81-84 6.1 本文的主要工作 81-82 6.2 有待继续研究的问题 82 6.3 结束语 82-84 致谢 84-85 参考文献 85-89 攻硕期间的研究工作 89-90
|
相似论文
- 基于微型无人平台导航多传感器信息融合算法研究,V249.32
- 多传感器组网及反隐身、抗干扰接力跟踪技术研究,TN953
- 图像拼接技术研究,TP391.41
- 舌体特征的提取及融合分类方法研究,TP391.41
- 双传感器图像联合目标检测及系统实现研究,TP391.41
- 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
- 红外超光谱图像的虚拟探测器研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多传感器信息融合及其在可穿戴计算机上的应用,TP202
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 农村高中生学习动机与阅读能力的相关性研究,G633.41
- 利用GST-标签大肠杆菌表达系统制备HPV 58 E7蛋白,R392
- 鸭源鸡杆菌抗体消长规律研究及抗脂多糖单抗杂交瘤细胞株的建立,S858.32
- 媒介融合中电视媒体的困境与出路,G206
- 电视传播中的粉丝文化效应,G223
- 稳定分泌抗羊种布鲁菌脂多糖单克隆抗体杂交瘤细胞株的建立,R392
- 嗜热菌几丁质结合域及其在酶固定化中应用的研究,Q814
- 海上平台消防系统研究,U698.4
- 稻瘟病菌SNARE蛋白的生物信息学分析及Mgsec22的功能研究,S435.111.41
- 猪白细胞介素2/6嵌合基因的融合表达及活性研究,S858.28
- 马链球菌兽疫亚种全菌结合类M蛋白亚单位灭活疫苗的研制,S858.28
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|