学位论文 > 优秀研究生学位论文题录展示
基于文本挖掘的医学诊疗案例推理系统的研究与应用
作 者: 李小展
导 师: 王勇
学 校: 广东工业大学
专 业: 计算机应用技术
关键词: 文本挖掘 医疗诊断 基于案例的推理 检索
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 71次
引 用: 0次
阅 读: 论文下载
内容摘要
随着科学技术的发展,信息技术的日益推广,我们的社会正在经历着一场前所未有的信息化革命,信息的发展推动了生产方式的变革,进而促进了人类文明的进步和经济的快速发展。在医疗卫生领域内,随着医疗市场竞争的激烈化,国内各个医疗机构不断的要求提高自己的医疗信息化程度,医院信息化程度的高低已成为衡量一个医院医疗水平的一个重要标准。本文在充分调研医疗辅助诊断系统的基础之上提出了基于文本挖掘的案例推理系统的框架。在电子病历的基础之上,进行文本挖掘,由于大部分的电子病历系统为非结构化或半结构化的文本,并不利于知识的检索和重用,本文首先通过文本预处理、中文分词、特征的提取等一系列的步骤把非结构化或半结构化的病历信息转化为结构化的知识,其次通过案例的表示,把结构化的信息以框架的形式表示出来,把案例的编号,案例的属性值,案例的诊断等作为案例表示的内容。案例库采用三级的结构进行组织:系统级案例库,代表案例库和子案例库。对案例库中的案例属性值进行聚类,按照子案例库中的案例相似度要尽可能的大,子案例库间的案例相似度要尽可能小的原则划分不同的子案例库。在案例间使用“案例间相似度最大和”的办法找出代表案例。本文对系统的关键技术做了全面的研究和分析,包括案例的检索、案例的学习、案例的修改、和案例的维护。其中案例的检索是案例案例推理的核心,直接决定着案例推理的效率,本文采用分阶段的权值最近邻法来提高案例检索的速度,首先确定究竟是在哪个系统案例库中,然后在代表案例库CASE中检索代表案例c,最后才在代表案例库c所在的子案例库中检索相似案例。案例之间的全局相似性由局部相似性组成,通过相似度阈值的设定可以很好的检索出所要求的案例。随着案例推理能力的不断增强,案例库中案例的会不断增多,需要定期对案例库进行修改和维护。通过一个患有支气管炎患者的诊断证明了基于文本挖掘的案例推理系统可以为医生的诊断提供辅助信息,最后对本文进行总结和展望,结束全文。
|
全文目录
摘要 4-5 Abstract 5-7 目录 7-9 CONTENTS 9-11 第一章 绪论 11-18 1.1 研究背景和意义 11-15 1.2 国内外研究现状 15-16 1.3 本文研究内容及章节安排 16-18 第二章 相关理论分析 18-27 2.1 自然语言处理 18-19 2.2 文本挖掘 19-22 2.2.1 文本挖掘常用技术 19-20 2.2.2 文本挖掘的过程 20-22 2.3 聚类算法 22-24 2.4 基于案例的推理 24-27 第三章 体系架构 27-32 3.1 工作流程 27-28 3.2 系统结构 28-29 3.3 系统组成 29-32 第四章 基于文本挖掘的案例管理 32-46 4.1 案例结构 32-33 4.2 电子病历文本挖掘 33-37 4.2.1 预处理 33 4.2.2 中文分词 33-36 4.2.3 特征提取 36-37 4.3 案例库组织 37-46 4.3.1 案例的表示 37-40 4.3.2 案例的属性权值 40-42 4.3.3 案例库的组织结构 42-46 第五章 案例推理算法 46-54 5.1 案例匹配与检索 46-51 5.1.1 案例相似度计算 48-49 5.1.2 分阶段的权值最近邻法 49-51 5.2 案例学习与修改 51-52 5.3 案例维护 52-54 第六章 应用分析 54-58 6.1 应用案例 54-57 6.1.1 案例 54 6.1.2 特征向量 54-55 6.1.3 案例匹配 55-57 6.2 结果分析 57-58 结论和展望 58-59 参考文献 59-62 攻读学位期间发表的论文 62-64 致谢 64
|
相似论文
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 基于词义及语义分析的问答技术研究,TP391.1
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 基于内容的服装图像检索技术研究及实现,TP391.41
- 基于多示例学习的用户关注概念区域发现,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 个性化检索中相似用户群的获取与更新,TP391.3
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 基于停用词处理的汉语语音检索方法,TP391.1
- 面向海量邮件的检索系统研究与实现,TP393.098
- 多样性密度学习算法的研究与应用,TP181
- 基于本体的语义检索研究,TP391.3
- 分面元数据在网站检索系统中的应用研究,G354.2
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 基于形状的汉画像检索技术研究,TP391.41
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 概率XML数据上关键字检索算法的研究与实现,TP391.3
- 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
- 新一代青岛市数字城建档案馆的设计与实现,G270.7
- 材料的分类及优化检索系统的研究与设计,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|