学位论文 > 优秀研究生学位论文题录展示

医疗诊断报告自动信息提取系统设计与开发

作 者: 宋晓波
导 师: 周水庚
学 校: 复旦大学
专 业: 计算机技术
关键词: 命名实体发现 隐马尔科夫模型 Viterbi算法 文本结构化 SNOMED CT
分类号: TP311.52
类 型: 硕士论文
年 份: 2009年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着各种医学信息系统在医疗机构中的投入使用,医院出具的诊断报告从纸质报告开始向电子报告转变。在实际应用中,国内的医学信息系统通常将检查描述、结论诊断等内容设置成自然语言的纯文本形式。医生在书写报告时可以比较自由地描述所见的情况,但这样的纯文本在进行检索时就遇到了检索困难和效率低下的问题。对于一些大型的教学、研究型医疗机构,医生经常在做特殊研究工作时需要对检查所见的情况,如一些疾病测量参数、疾病人群进行分类查询与统计。针对这一情况,有必要将这些医学描述信息进行提取处理,将文本中诸如疾病、症状、检查等多方面内容按照标准的医学术语集进行结构化分类,重新填入数据库,供医生、科研人员等进行查询使用,从而为医学研究统计提供有效信息。本文的主要研究了信息提取技术中基于隐马尔科夫模型的命名实体发现方法。针对医疗信息文本的特点,在进行识别之前先对文本进行预处理,采用机械识别和领域专家人工识别的方式将半结构化和非结构化的文本中可以初步识别的医学术语提取,然后在采用基于隐马尔科夫模型的方法来识别命名实体,采用基于过滤束搜索思想改进的Viterbi算法来计算隐马尔科夫模型中最优状态路径,以保证系统运行效率。基于规则的文本结构化,提取实体关系的过程中,通过短语成分组分析和重写规则拆分的方法,将文本信息拆分成片段,用于提取医学命名实体之间的关系。同时参考SNOMED CT术语集的体系架构,构建了一个易于理解和未来扩展的文本结构化框架。利用上述两种技术,针对医学文本研究的具体应用需求,设计开发了一个医学诊断报告自动信息提取系统,可以从医学报告中提取出所需医学术语和其属性描述。

全文目录


摘要  3-4
Abstract  4-5
第一章 引言  5-10
  1.1 研究背景  5-7
  1.2 国内外研究现状  7-8
  1.3 本文研究的主要内容和章节安排  8-10
第二章 医学诊断报告与信息提取  10-14
  2.1 医疗诊断报告在医院信息系统中的应用  10-11
  2.2 信息提取技术简介  11-13
  2.3 SNOMED CT简介  13
  2.4 本章小结  13-14
第三章 医学命名实体的识别  14-27
  3.1 医学信息中的命名实体特点  14-15
  3.2 隐马尔科夫模型概述  15-17
  3.3 检索与分词  17-20
  3.4 命名实体识别模型  20-26
  3.5 本章小结  26-27
第四章 文本结构化  27-31
  4.1 文本结构化的规则  27-28
  4.2 结构设计  28-30
  4.3 本章小结  30-31
第五章 医学诊断报告自动信息提取系统架构  31-41
  5.1 系统综述  31-32
  5.2 系统模块  32-39
  5.3 系统评测  39-40
  5.4 本章小结  40-41
第六章 总结  41-43
  6.1 本文完成的工作  41
  6.2 后续工作  41-43
参考文献  43-45
致谢  45-46

相似论文

  1. 音乐信号节奏信息实时获取技术研究与系统实现,TN912.3
  2. 基于HMM的单字估价值的中文自动分词研究,TP391.1
  3. 多机动目标跟踪中数据关联算法的研究,TN953
  4. 基于序列标注的中文依存句法分析研究,TP391.1
  5. 基于FPGA的Viterbi译码器设计与实现,TN764
  6. 基于隐马尔科夫模型的中文命名实体识别研究,TP391.1
  7. 基于隐马尔科夫模型的细胞分裂检测,TP391.41
  8. 软判决译码在信道编码中的应用,TN911.22
  9. 短波数传中Turbo均衡算法研究,TN911.5
  10. 卷积码译码次优路径算法在第三代移动通信中的应用,TN929.5
  11. 邮政信封的版面分析及字符切分,TP391.4
  12. 最大似然序列估计均衡技术研究,TN911.22
  13. 电子战条件下目标跟踪算法研究,TN971
  14. 多用户检测技术在异步WCDMA中的应用,TN929.533
  15. Golay码/卷积码在数字集群系统中的应用研究,TN929.5
  16. 基于驻留时间的隐马氏模型的建立及算法研究,O211.6
  17. 隐马氏模型的建模及其应用,O211.6
  18. 装备发展战略研究信息化平台中汉语文本信息提取技术的研究,E91
  19. 汉语词法分析技术及其在机器人辅助教育智能接口中的应用研究,TP391.1
  20. HMM的学习问题和解码问题研究,O211.62

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com