学位论文 > 优秀研究生学位论文题录展示

用于中药方剂知识发现的若干数据挖掘方法研究

作 者: 王峰
导 师: 谢俊元
学 校: 南京大学
专 业: 计算机软件与理论
关键词: 数据挖掘 中药方剂 配伍规律 兴趣度 LDA
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 96次
引 用: 0次
阅 读: 论文下载
 

内容摘要


中医药学是中国传统文化的重要组成部分和人类智慧的结晶,其在人类历史尤其是古代人们与疾病抗争中发挥了重要的作用。中药方剂是中医药学的一门重要学科,其配伍规律有着重要的意义。中医药经过几千年的发展积累了丰富的资料和大量的经典书籍,面对如此海量的数据,普通的人工处理方法已经难以满足人们对中医药理论研究的需求。因此,对中医药的信息化研究已经迫在眉睫。本文主要通过数据挖掘技术对中药方剂进行研究,论文主要工作如下:1)提出一种基于药物顺序贡献度的方法来发现方剂中的核心药物,此算法可以挖掘出频次方法中忽略的一些低频药物。2)定义药物距离的概念,并结合标准点式互信息得到一个评价药物关联程度的指标DPMI,在DPMI的基础上提出一种类似Apriori的药物组合挖掘算法,此算法挖掘出的药物组合既有经常使用的传统药对,也有桑白皮、茯苓和地骨皮等一些有效的药物组合。3)引入兴趣度的概念,把支持度和兴趣度结合起来,提出了一种基于兴趣度的FP-Growth算法对方剂进行挖掘,此算法无论是在降低频繁项集规模,还是在算法时间效率上都取得很好的效果。4)使用LDA模型对方剂进行挖掘,根据LDA模型药物主题下的药物分布获得药物的聚类,并基于方剂的主题分布,对方剂进行层次聚类。由实验结果可知,基于主题的LDA模型对肺痿方剂的药物和方剂聚类均有很好的效果。

全文目录


摘要  5-6
Abstract  6-10
第一章 绪论  10-19
  1.1 引言  10-15
    1.1.1 中医药方剂研究背景  10-11
    1.1.2 数据挖掘研究背景  11-14
    1.1.3 中医药数据挖掘的必要性和可行性  14-15
  1.2 中医药数据挖掘研究现状  15-17
  1.3 本文工作及组织结构  17-19
第二章 基于顺序贡献度的核心药物挖掘算法  19-24
  2.1 引言  19
  2.2 思想描述  19-20
  2.3 算法描述  20-21
  2.4 试验  21-23
    2.4.1 实验设置  21
    2.4.2 实验结果与分析  21-23
  2.5 本章小结  23-24
第三章 基于DPMI的药物组合挖掘算法  24-33
  3.1 引言  24
  3.2 思想描述  24-28
    3.2.1 点式互信息  24-25
    3.2.2 药物距离  25-26
    3.2.3 基于距离的标准点式互信息评价指标DPMI  26-27
    3.2.4 强相关集  27-28
  3.3 算法描述  28-29
  3.4 实验  29-32
    3.4.1 实验设置  29-30
    3.4.2 实验结果与分析  30-32
  3.5 本章小结  32-33
第四章 基于兴趣度的药物关联模式挖掘  33-48
  4.1 引言  33
  4.2 常用关联规则算法  33-39
    4.2.1 基本概念  33-34
    4.2.2 Apriori算法简介  34-36
    4.2.3 FP-Growth算法简介  36-39
  4.3 思想描述  39-41
  4.4 算法描述  41-42
  4.5 实验  42-47
    4.5.1 实验设置  42
    4.5.2 实验结果与分析  42-47
  4.6 本章小结  47-48
第五章 基于LDA模型的方剂聚类  48-65
  5.1 引言  48
  5.2 概率知识  48-51
    5.2.1 二元变量  48-49
    5.2.2 Beta分布  49-50
    5.2.3 多元变量  50
    5.2.4 Dirichlet分布  50-51
  5.3 LDA模型简介  51-59
    5.3.1 混合模型  53-54
    5.3.2 生成模型  54
    5.3.3 似然函数  54-55
    5.3.4 Gibbs采样推断  55
    5.3.5 LDA Gibbs采样算法  55-59
  5.4 思想描述  59
  5.5 算法描述  59-61
  5.6 实验  61-64
    5.6.1 实验设置  61-62
    5.6.2 中药聚类结果与分析  62
    5.6.3 方剂聚类结果与分析  62-64
  5.7 本章小结  64-65
第六章 总结与展望  65-67
  6.1 本文工作总结  65
  6.2 进一步工作展望  65-67
参考文献  67-70
致谢  70-71
附录  71-72

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 止嗽散治疗慢性咳嗽的配伍规律研究,R256.11
  4. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  5. Bicluster数据分析软件设计与实现,TP311.52
  6. 基于变异粒子群的聚类算法研究,TP18
  7. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  8. 基于遗传算法和粗糙集的聚类算法研究,TP18
  9. 基于数据挖掘的税务稽查选案研究,F812.42
  10. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  11. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  12. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  13. 基于行业参数优化模型的投资项目决策支持系统,F283
  14. 数据集市在电信经营分析中的应用研究,TP311.13
  15. 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
  16. 基于统计结构的联机手写藏文识别特征抽取研究,TP391.41
  17. 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
  18. 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
  19. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  20. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  21. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com