学位论文 > 优秀研究生学位论文题录展示
蛋白质关系网络中的络合物发现算法的研究
作 者: 唐楠
导 师: 杨志豪
学 校: 大连理工大学
专 业: 计算机应用技术
关键词: 蛋白质关系 蛋白质关系网络 络合物抽取 监督学习
分类号: Q51-3
类 型: 硕士论文
年 份: 2011年
下 载: 12次
引 用: 0次
阅 读: 论文下载
内容摘要
随着生物医学界大量生物医学实验的实现,产生了海量的蛋白质关系数据,这些蛋白质关系构成了现有的蛋白质关系数据库。而海量的蛋白质关系能够形成复杂的网络,在复杂的关系网络中抽取有效的信息成为当前的研究热点,其中络合物预测和模块结构预测是这个领域的重要课题。蛋白质络合物由两个或多个蛋白质构成,这些蛋白质相互作用共同完成某种生物功能,在生物过程中有着重要作用。因此,络合物的发现和研究对研究生物细胞的组织和生物功能有着重要的意义。而大量的蛋白质关系数据构成的网络恰好为自动抽取络合物提供了很好的数据依据。本文首先介绍了相关的络合物抽取技术及研究概况,经典络合物发现算法的简要介绍,并分析了其存在的问题等。然后分析了生物网络的结构特征以及复杂网络的性质,由于复杂网络的模块性,使得发现络合物成为可能。针对经典的方法存在的问题,提出了基于多core结构融合的络合物发现算法和基于监督学习方法的络合物发现算法。基于多core结构融合的络合物发现算法主要解决了多数络合物发现算法只基于单一网络进行络合物发现的缺点。本文针对三种不同的网络,采取不同的方法抽取候选core结构,然后将候选core结构进行融合,再对候选core结构集合过滤,并通过判定attachment蛋白质从而得到较好的络合物预测结果。最后,提出了一种基于监督学习的络合物发现算法,解决了传统的无监督方法无法利用多种络合物信息的缺点。该方法将多种信息作为络合物发现特征,如基因本体信息,权重聚类系数等,构建了含有十八个特征的特征集。并引入了三分类模型,使用了回归方法进行模型的训练。将训练得到的模型用于络合物发现算法中,该络合物发现算法基于完全子图实现。络合物发现实验从参数对比,模型对比,特征对比和其他方法对比等多个角度进行了实验,实验结果表明该方法能够有效的抽取络合物。总之,本文从多网络融合发现络合物和使用监督学习方法改进络合物发现算法两个角度进行了研究工作。实验结果表明,监督学习应用到络合物发现领域是可行的,并且能够更好的达到络合物发现的目的。
|
全文目录
摘要 4-5 Abstract 5-9 1 绪论 9-14 1.1 研究背景 9 1.2 络合物发现的研究现状 9-12 1.2.1 基于密度的方法 9-10 1.2.2 层次聚类算法 10-11 1.2.3 图切割算法 11 1.2.4 基于核心-附属结构的方法 11-12 1.3 存在问题及解决 12 1.4 本文工作 12-13 1.5 本文结构 13-14 2 蛋白质关系网络性质及应用 14-19 2.1 复杂网络的特征及度量指标 14-15 2.2 蛋白质关系网络的性质 15-17 2.3 蛋白质关系网络中的应用 17-18 2.4 本章小结 18-19 3 基于core结构融合的络合物发现算法 19-28 3.1 三种网络网络介绍 19-20 3.2 算法流程 20-22 3.2.1 基于三种网络的候选core抽取 20-21 3.2.2 候完备候选core集合 21 3.2.3 过滤候选core集合 21 3.2.4 判定attachment蛋白质 21-22 3.3 实验设计 22-26 3.4 结果分析 26 3.5 本章小结 26-28 4 基于监督学习络合物发现算法 28-51 4.1 特征设计 28-29 4.2 权重网络构建 29-30 4.3 Regression模型 30-31 4.4 算法流程 31-34 4.4.1 构造训练集训练模型 32-33 4.4.2 完全子图发现算法 33 4.4.3 完全子图的扩张 33 4.4.4 候选络合物过滤 33-34 4.5 语料来源和评价指标 34-37 4.5.1 实验语料来源 34-35 4.5.2 评价指标 35-37 4.6 实验描述及实验结果 37-50 4.6.1 不同参数间的结果对比 37-41 4.6.2 不同特征集的结果对比 41-44 4.6.3 与其他方法的对比 44-47 4.6.4 预测结果的统计学检验 47-50 4.7 本章小结 50-51 结论 51-52 参考文献 52-56 攻读硕士学位期间发表学术论文情况 56-58 致谢 58-59
|
相似论文
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- 监督主题模型的研究与应用,TP391.1
- 长文本辅助短文本的知识迁移聚类方法,TP391.1
- 基于半监督哈希算法的图像检索方法研究,TP391.41
- 蛋白质关系网络复合物发现与可视化研究,TP391.41
- 基于半监督学习的时间序列分类研究与实现,TP181
- 基于丰富特征和多核学习的蛋白质关系抽取,Q51
- 数据挖掘在研究生调剂中的应用研究,TP311.13
- 半监督学习中协同训练与多视图方法的比较及改进,TP18
- 基于半监督SVM的入侵检测研究,TP393.08
- 面向自然场景分类的稀疏编码研究与应用,TP391.41
- 面向金融问答的论坛观点挖掘,TP391.3
- 基于自适应的LVCSR系统半监督学习方法的研究,TN912.34
- 基于支持向量机的水电故障分类器的设计与实现,TV738
- 健壮的流形学习算法及其应用研究,TP181
- 半监督学习若干问题的研究,TP181
- 基于少量标记数据约束聚类算法的入侵检测技术研究,TP393.08
- 基于半监督学习的中文问句分类研究,TP391.1
- 基于半监督学习的图像分割系统的设计与实现,TP391.41
- 基于嵌入空间的降维算法建模研究及应用,TP311.13
中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com
|