学位论文 > 优秀研究生学位论文题录展示

多样性密度学习算法的研究与应用

作 者: 徐磊
导 师: 郭茂祖
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 多示例学习 多概念DD算法 重叠示例分类 图像检索 microRNA前体
分类号: TP181
类 型: 硕士论文
年 份: 2008年
下 载: 77次
引 用: 0次
阅 读: 论文下载
 

内容摘要


多示例学习是与监督学习、非监督学习和强化学习并列的第四类学习框架,目前已广泛应用于药物设计、图像搜索等领域,并已获得很好的效果。在多示例学习中,训练样本是由多个示例组成的包,包是有概念标记的,但示例本身却没有概念标记,学习的目的是预测新包的类别。多样性密度(DD)算法是一种典型的多示例学习算法,能够根据概率学习到比较接近的目标函数,但DD算法尚存在两点不足。首先,DD算法只学习到一个目标函数,该算法的学习能力有待提高;其次,在预测新包时,如果一个包中至少包含一个正例,则该包是一个正包,否则即为反包,没有考虑某些样本存在正例稀疏的特点,在对重叠示例的包进行分类时,通常出现把反包误分为正包的情况。首先,本文针对DD算法只能学习到一个目标函数的缺点,提出了多概念DD算法,多概念DD算法通过学习多个目标函数,较全面的描述目标概念。其次,本文针对在预测新包时,没有考虑某些样本存在正例稀疏的特点,提出了基于重叠示例的分类算法,该算法通过改变示例在包分类时的影响策略,消除反包中个别示例的噪声。本文在理论优化的基础上,将改进算法应用在图像检索和鉴别microRNA前体中。在图像检索中,将多概念DD算法与基于重叠示例的分类算法相结合,多概念DD算法全面获得了读者感兴趣的概念,重叠示例的分类算法滤除了反包中个别有正例性质的噪声,并且实验结果优于以前的DD算法;另外,本文使用多示例学习算法鉴别microRNA前体的真伪,使用重叠示例的分类算法对真伪microRNA前体进行分类,也得到了理想的效果。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-16
  1.1 课题的背景和来源  9
  1.2 国内外的发展及现状  9-14
    1.2.1 多示例学习的研究现状  10-14
    1.2.2 多示例学习方法中的不足  14
  1.3 本课题的主要研究内容  14-16
第2章 多样性密度学习算法研究  16-28
  2.1 引言  16
  2.2 传统的多示例学习  16-22
    2.2.1 多样性密度算法  18-21
    2.2.2 多示例分类算法  21-22
  2.3 优化的多样性密度学习算法  22-27
    2.3.1 多概念多示例学习算法  22-25
    2.3.2 基于重叠示例的多示例分类算法  25-27
  2.4 本章小结  27-28
第3章 优化的多样性密度算法在图像检索中的应用  28-45
  3.1 引言  28
  3.2 基于内容的图像检索系统  28-30
  3.3 基于多示例学习的图像检索技术  30-36
    3.3.1 包的生成  30-32
    3.3.2 目标概念的学习  32-34
    3.3.3 相似度比较  34-36
  3.4 性能评价  36-37
    3.4.1 查准率和查全率  36
    3.4.2 ROC曲线  36-37
  3.5 结果分析  37-40
  3.6 系统描述  40-44
    3.6.1 基于多示例学习的图像检索系统框架  40-41
    3.6.2 模块设计  41-43
    3.6.3 数据接口设计  43
    3.6.4 系统设置  43-44
  3.7 本章小结  44-45
第4章 优化的分类算法在生物信息学中的应用  45-54
  4.1 引言  45
  4.2 miRNA的概念与特征  45-48
  4.3 真伪miRNA的鉴别  48-51
    4.3.1 miRNA前体特征的提取  49-50
    4.3.2 多示例学习鉴别真伪miRNA  50-51
  4.4 结果分析  51-53
  4.5 本章小结  53-54
结论  54-55
参考文献  55-59
攻读学位期间发表的学术论文  59-61
致谢  61-62
个人简历  62

相似论文

  1. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  2. 基于用户兴趣特征的图像检索研究与实现,TP391.41
  3. Q学习在基于内容图像检索技术中的应用,TP391.41
  4. 基于多示例学习的用户关注概念区域发现,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 多模式图像检索方法研究,TP391.41
  7. 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
  8. 基于颜色和纹理特征的图像检索算法研究,TP391.41
  9. 基于多示例学习的超声乳腺肿瘤良恶性分类,TP391.7
  10. 基于内容的图像检索中特征性能分析,TP391.41
  11. 基于感兴趣区域的图像分割及其在图像检索中的应用,TP391.41
  12. 基于综合特征和相关反馈的图像检索技术研究,TP391.41
  13. 基于内容的彩色图像检索研究,TP391.41
  14. 基于颜色的图像检索技术研究,TP391.41
  15. 形状特征提取及检索技术研究,TP391.41
  16. 基于数据融合的图像检索系统设计,TP391.41
  17. 融合进高层语义特征的医学图像检索技术研究,TP391.3
  18. 基于底层特征和相关反馈的医学图像检索,TP391.41
  19. 基于BP神经网络的语义风景图像检索技术的研究,TP391.41
  20. 基于内容的黄色图像识别,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com