学位论文 > 优秀研究生学位论文题录展示
多样性密度学习算法的研究与应用
作 者: 徐磊
导 师: 郭茂祖
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 多示例学习 多概念DD算法 重叠示例分类 图像检索 microRNA前体
分类号: TP181
类 型: 硕士论文
年 份: 2008年
下 载: 77次
引 用: 0次
阅 读: 论文下载
内容摘要
多示例学习是与监督学习、非监督学习和强化学习并列的第四类学习框架,目前已广泛应用于药物设计、图像搜索等领域,并已获得很好的效果。在多示例学习中,训练样本是由多个示例组成的包,包是有概念标记的,但示例本身却没有概念标记,学习的目的是预测新包的类别。多样性密度(DD)算法是一种典型的多示例学习算法,能够根据概率学习到比较接近的目标函数,但DD算法尚存在两点不足。首先,DD算法只学习到一个目标函数,该算法的学习能力有待提高;其次,在预测新包时,如果一个包中至少包含一个正例,则该包是一个正包,否则即为反包,没有考虑某些样本存在正例稀疏的特点,在对重叠示例的包进行分类时,通常出现把反包误分为正包的情况。首先,本文针对DD算法只能学习到一个目标函数的缺点,提出了多概念DD算法,多概念DD算法通过学习多个目标函数,较全面的描述目标概念。其次,本文针对在预测新包时,没有考虑某些样本存在正例稀疏的特点,提出了基于重叠示例的分类算法,该算法通过改变示例在包分类时的影响策略,消除反包中个别示例的噪声。本文在理论优化的基础上,将改进算法应用在图像检索和鉴别microRNA前体中。在图像检索中,将多概念DD算法与基于重叠示例的分类算法相结合,多概念DD算法全面获得了读者感兴趣的概念,重叠示例的分类算法滤除了反包中个别有正例性质的噪声,并且实验结果优于以前的DD算法;另外,本文使用多示例学习算法鉴别microRNA前体的真伪,使用重叠示例的分类算法对真伪microRNA前体进行分类,也得到了理想的效果。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-16 1.1 课题的背景和来源 9 1.2 国内外的发展及现状 9-14 1.2.1 多示例学习的研究现状 10-14 1.2.2 多示例学习方法中的不足 14 1.3 本课题的主要研究内容 14-16 第2章 多样性密度学习算法研究 16-28 2.1 引言 16 2.2 传统的多示例学习 16-22 2.2.1 多样性密度算法 18-21 2.2.2 多示例分类算法 21-22 2.3 优化的多样性密度学习算法 22-27 2.3.1 多概念多示例学习算法 22-25 2.3.2 基于重叠示例的多示例分类算法 25-27 2.4 本章小结 27-28 第3章 优化的多样性密度算法在图像检索中的应用 28-45 3.1 引言 28 3.2 基于内容的图像检索系统 28-30 3.3 基于多示例学习的图像检索技术 30-36 3.3.1 包的生成 30-32 3.3.2 目标概念的学习 32-34 3.3.3 相似度比较 34-36 3.4 性能评价 36-37 3.4.1 查准率和查全率 36 3.4.2 ROC曲线 36-37 3.5 结果分析 37-40 3.6 系统描述 40-44 3.6.1 基于多示例学习的图像检索系统框架 40-41 3.6.2 模块设计 41-43 3.6.3 数据接口设计 43 3.6.4 系统设置 43-44 3.7 本章小结 44-45 第4章 优化的分类算法在生物信息学中的应用 45-54 4.1 引言 45 4.2 miRNA的概念与特征 45-48 4.3 真伪miRNA的鉴别 48-51 4.3.1 miRNA前体特征的提取 49-50 4.3.2 多示例学习鉴别真伪miRNA 50-51 4.4 结果分析 51-53 4.5 本章小结 53-54 结论 54-55 参考文献 55-59 攻读学位期间发表的学术论文 59-61 致谢 61-62 个人简历 62
|
相似论文
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 基于多示例学习的用户关注概念区域发现,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 多模式图像检索方法研究,TP391.41
- 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
- 基于颜色和纹理特征的图像检索算法研究,TP391.41
- 基于多示例学习的超声乳腺肿瘤良恶性分类,TP391.7
- 基于内容的图像检索中特征性能分析,TP391.41
- 基于感兴趣区域的图像分割及其在图像检索中的应用,TP391.41
- 基于综合特征和相关反馈的图像检索技术研究,TP391.41
- 基于内容的彩色图像检索研究,TP391.41
- 基于颜色的图像检索技术研究,TP391.41
- 形状特征提取及检索技术研究,TP391.41
- 基于数据融合的图像检索系统设计,TP391.41
- 融合进高层语义特征的医学图像检索技术研究,TP391.3
- 基于底层特征和相关反馈的医学图像检索,TP391.41
- 基于BP神经网络的语义风景图像检索技术的研究,TP391.41
- 基于内容的黄色图像识别,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|