学位论文 > 优秀研究生学位论文题录展示
药物定量构效关系建模新方法研究
作 者: 李剑
导 师: 陈德钊
学 校: 浙江大学
专 业: 化学工程
关键词: 径向基网络 循环子空间回归 定量构效关系 遗传算法 优进策略 参数优化 最小二乘支持向量机 偏最小二乘 基于误差修正 泛化性能
分类号: TQ460.1
类 型: 硕士论文
年 份: 2005年
下 载: 316次
引 用: 3次
阅 读: 论文下载
内容摘要
药物定量构效关系(Quantitative Structure-ActivityRelationships,QSAR)的研究对象是药物生理活性和分子结构参数间的量变规律。建立适当的数学模型对QSAR研究来说是非常重要的,通过合适的模型可以预测未知化合物的活性,探讨药物作用机理,对指导新药的设计与合成有重要意义。为此,本文提出两种新的非线性建模方法,并将它们应用于药物QSAR建模,结果显示这两种模型有良好泛化性能和稳定性。以下是本文的主要内容:(1) 分析了循环子空间回归(Cyclic Subspace Regression,CSR)的特点,并介绍了CSR的两种稳健算法。而后将径向基网络(Radial Basis FunctionsNetworks,RBFN)与循环子空间回归相结合构成了RBF-CSR方法,该方法既保留了神经网络的结构,又用数学方法直接求解,免去了人工神经网络冗长的训练过程,并可在更广的空间内寻找最优的网络参数,很好的解决了RBF网络训练量大,难以找到最优解的问题。(2) 针对简单遗传算法易早熟、全局寻优效率偏低等特点,设计了一种基于优进策略的遗传算法(Eugenic evolution Genetic Algorithm,EGA),在演进过程中自适应地改善个体地分布,适时引入确定性操作,以改善常规遗传算法的性能。并将EGA用于RBF-CSR网络的参数优化,构建了EGA-RBF-CSR方法。最后将EGA-RBF-CSR方法用于苯已酰胺类除草剂的定量构效关系建模,取得了良好的效果。(3) 回顾了统计学习理论研究的基本问题及主要内容。而后回顾了支持向量机(Support vector machine,SVM)原理和实现,简要介绍了国际上常用的各种SVM优化算法。介绍了最小二乘支持向量机(Least squares support vector machine,LSSVM)及其算法,该方法是标准支持向量机在二次损失函数下的一种扩展形式,它保留了SVM的一些优点,同时具有计算量小、求解速度快等特点。(4) 提出了一种基于最小二乘支持向量机的非线性偏最小二乘建模算法。该算法采用非线性迭代偏最小二乘(Nonlinear Partial Least Squares,NIPALS)方法从样本数据中成对地提取最优成分,使多变量系统降维,然后应用基于结构风险最小化准则的最小二乘支持向量机,对提取的成对成分进行非线性拟合,并加入基于误差的权值调整策略,构成EB-LSSVM-PLS模型。最后,将该方法应用于敏浙江大学硕士学位论文小样本的新型黄烷酮衍生物的QSAR建模,取得了满意的效果。 文章最后对所做的工作进行了总结,并在此基础上,提出了今后的研究发·展方向。关键词:径向基网络,循环子空间回归,定量构效关系,遗传算法,优进策略,参数优化,最小二乘支持向量机,偏最小二乘,基于误差修正,泛化性能谷
|
全文目录
摘要 4-6 Abstract 6-11 第一章 绪论 11-22 1. 1 基于观测数据的建模 11-12 1. 2 药物定量构效关系(QSAR)研究 12-13 1. 2. 1 QSAR的概念 12 1. 2. 2 QSAR研究的基本过程 12-13 1. 3 基于观测数据的主要建模方法 13-21 1. 3. 1 最小二乘回归 13-14 1. 3. 2 主成分回归 14-17 1. 3. 3 偏最小二乘回归 17-19 1. 3. 4 神经网络 19-20 1. 3. 5 新近出现的方法 20-21 1. 4 本文内容组织 21-22 第二章 CSR-RBF网络 22-30 2. 1 RBF网络简介 22-24 2. 1. 1 RBF网络的结构 22-23 2. 1. 2 RBF网络的学习 23-24 2. 2 循环子空间回归(CSR) 24-27 2. 2. 1 循环子空间回归(CSR)的原理 24-25 2. 2. 2 CSR的稳健算法 25-26 2. 2. 3 CSR的快速稳健算法 26-27 2. 3 RBF-CSR网络的构建 27-28 2. 3. 1 RBF-PLS网络简介 27-28 2. 3. 2 构建RBF-CSR网络 28 2. 4 小结 28-30 第三章 EGA-RBF-CSR网络为药物构效关系建模 30-41 3. 1 简单遗传算法 30-33 3. 1. 1 简单遗传算法概述 30-32 3. 1. 2 简单遗传算法(SGA)用作参数优化 32-33 3. 2 EGA-RBF-CSR方法的构建 33-37 3. 2. 1 EGA的提出 34 3. 2. 2 EGA-RBF-CSR的设计 34-37 3. 3 EGA-RBF-CSR方法为苯乙酰胺类除草剂QSAR建模 37-40 3. 3. 1 建模步骤 37-38 3. 3. 2 结果及讨论 38-40 3. 4 小结 40-41 第四章 统计学习理论与支持向量机 41-54 4. 1 统计学习理论 41-45 4. 1. 1 VC维 41-42 4. 1. 2 经验风险最小化原则 42-44 4. 1. 3 结构风险最小化原则 44-45 4. 2 支持向量机用于分类 45-47 4. 3 支持向量机用于回归 47 4. 4 SVM中的优化算法 47-53 4. 4. 1 SVM中优化算法的理论基础 48-49 4. 4. 2 SVM发展初期常用的优化算法 49-50 4. 4. 3 国际上近期出现的SVM优化算法 50-52 4. 4. 4 各种优化算法的分析比较 52-53 4. 5 小结 53-54 第五章 基于LSSVM的非线性PLS为QSAR建模 54-67 5. 1 非线性PLS 54-58 5. 1. 1 基于样本数据变换的NLPLS 54-57 5. 1. 2 基于内部非线性映射的NLPLS 57-58 5. 2 LSSVM-PLS方法的构建 58-64 5. 2. 1 LSSVM的原理 58-60 5. 2. 2 LSSVM-PLS的原理 60-61 5. 2. 3 基于误差(error-based)的权值调整策略 61-62 5. 2. 4 用于EB-LSSVM-PLS的改进NIPALS算法 62-64 5. 3 EB-LSSVM-PLS为黄烷酮类衍生物的QSAR建模 64-66 5. 3. 1 引言 64 5. 3. 2 试验方式与性能评价指标 64-65 5. 3. 3 结果与分析 65-66 5. 4 小结 66-67 第六章 总结与展望 67-70 6. 1 总结 67-68 6. 2 展望 68-70 参考文献 70-76 致谢 76-77 作者攻读硕士学位期间完成的论文及科研项目 77
|
相似论文
- 支持向量机在双酚A软测量中的应用,O213.1
- 支持向量机回归算法的研究与应用,TP18
- CMAC神经网络的泛比性能研究及其在IVSC控制中的作用,TP183
- 多层前馈神经网络泛化性能改进研究,TP183
- 基于层次分类和集成学习的文本分类技术研究,TP391.1
- 小波神经网络与BP网络的比较研究及应用,O233
- 径向基函数神经网络及其在船舶运动控制中的应用研究,U675.9
- 朝阳地区参考作物腾发量演变特征与预测模型研究,S161.4
- Logistic回归多重共线性的诊断与改进及其在医学中的应用,R195
- 乙肝病毒性肝硬化的血清代谢轮廓分析,R512.62
- 基于偏最小二乘的高炉铁水硅含量预测研究,TF325.6
- 压电传感器真菌鉴定中的应用及镍和柠檬酸配位研究,R446.5
- 基于近红外光谱技术的蔬菜中农药残留量检测方法研究,TP274
- 近红外光谱技术在鱼粉质量快速鉴定中的应用,TS254.7
- 配电网中长期负荷预测方法研究,TM715
- 冬小麦水分生产函数建模方法研究,S512.11
- 基于多变量统计投影方法的控制器设计及过程检测研究,TM571.6
- 统计过程控制在丹参注射液生产质量控制中的应用研究,TQ461
- 基于线性回归模型的基因调控网络重构算法的研究,Q75
- 固定床间歇煤气化工艺的分析,TQ546
中图分类: > 工业技术 > 化学工业 > 制药化学工业 > 一般性问题 > 基础理论
© 2012 www.xueweilunwen.com
|