学位论文 > 优秀研究生学位论文题录展示

基于唇动检测的影视作品对白单元切分

作 者: 秦蕾
导 师: 姚鸿勋
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 影视作品 唇动 说话检测 亮度信息 LBP
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 6次
引 用: 0次
阅 读: 论文下载
 

内容摘要


影视作品是以视频的形式呈现在观众面前的,因此对影视作品进行对白单元切分,实际上就是对视频进行对白单元切分。本论文的工作目标是希望通过对视频中张嘴说话状态的检测来分割影视作品中对白单元片段。通过输入一段视频,检测出视频中人物说话段落。影视作品中对白单元的切分可用于后续的视频语义关联分析、视频摘要、检索等。对影视作品中的对白单元进行切分有着重要的理论意义和实用价值。影视作品中对白单元的切分的研究涉及模式识别、计算机视觉、图像处理、数字信号处理等多个相关领域,它所研究的内容涉及到了这些领域的最新的研究进展。本文的主要研究工作如下:1.提出了基于嘴部亮度信息变化的唇动检测切分算法。首先提出了基于嘴部低亮度信息的检测切分算法,该方法基于人说话时口腔内部低亮度像素数量的显著变化特点提出的。这是由于人们在说话的时候口腔部分暴露出来了。而口腔通常都处于阴影中,因此口腔像素占有的亮度值都属于低灰度亮度范围。因此可以采用大量的嘴唇区域低亮度像素来指示唇动,用来检测。实验结果表明,该方法能够比较准确的检测出视频中的说话部分。在基于嘴部低亮度信息的检测方法基础上又提出了改进算法。由于人们在说话时候经常会露出牙齿,这些高亮度像素直接干扰低亮度像素的检测结果。因此本文又利用高亮度像素信息补充到低亮度像素信息检测规则中,进而提高了检测的准确度。2.提出了基于时序LBP直方图的说话检测切分算法。人在说话时,上下嘴唇是动的,纹理信息在时间上变化明显。人不说话时,上下嘴唇基本不动,纹理信息在时间上基本维持稳定。张开嘴部的纹理信息和闭合嘴部的纹理信息明显不同。综合利用时序和纹理信息,提出了基于时序LBP直方图的算法。实验结果表明,该方法能够获得较高的正确检测率。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-14
  1.1 课题的研究意义和背景  9-11
    1.1.1 课题来源  9
    1.1.2 研究的目的和意义  9-11
  1.2 课题研究现状  11-12
  1.3 本文研究内容  12-14
第2章 面部感知和唇动检测技术  14-27
  2.1 人脸检测技术  14-18
    2.1.1 基于模板的方法  15-16
    2.1.2 基于肤色模型的方法  16-17
    2.1.3 基于统计理论的方法  17-18
  2.2 唇动检测技术  18-25
    2.2.1 基于色彩特征的方法  19-21
    2.2.2 基于可变模板的方法  21-23
    2.2.3 Viola经典检测框架  23-25
  2.3 本章小结  25-27
第3章 基于嘴部亮度信息的唇动检测切分  27-47
  3.1 基于嘴部低亮度信息的检测切分算法  27-39
    3.1.1 算法实现的理论基础  27-29
    3.1.2 Neyman-Pearson假设检验理论  29-30
    3.1.3 说话检测切分理论  30-32
    3.1.4 低亮度信息检测切分算法系统流程  32-33
    3.1.5 基于低亮度检测切分算法的实验结果  33-39
  3.2 改进基于低亮度信息的检测切分算法  39-46
    3.2.1 改进算法的基本思想  40
    3.2.2 改进算法的系统流程  40-42
    3.2.3 改进低亮度检测切分算法的实验结果  42-46
  3.3 本章小结  46-47
第4章 基于时序LBP直方图的说话检测切分  47-61
  4.1 局部二值模式  47-49
    4.1.1 局部二值模式算子  47-49
  4.2 时序LBP直方图算法  49-51
    4.2.1 时序局部二值模式直方图描述子  49-50
    4.2.2 分类函数  50-51
  4.3 支持向量机  51-53
  4.4 时序LBP直方图系统流程  53-55
  4.5 时序LBP直方图算法的实验结果  55-59
  4.6 本章小结  59-61
结论  61-63
参考文献  63-69
致谢  69

相似论文

  1. 基于内容的服装图像检索技术研究及实现,TP391.41
  2. 基于差分演化的人脸识别方法研究,TP391.41
  3. 影视作品著作权归属问题探究,D923.41
  4. 基于改进型SURF算法的电子稳像技术研究,TP391.41
  5. 基于局部二元模式和韦伯局部描述符的人脸识别,TP391.41
  6. 可变光照和遮挡条件下的人脸识别技术研究及其应用,TP391.41
  7. 网络影视作品定时播放侵权案例研究,D923.41
  8. 外国影视作品影响下的越南青少年教育问题,G533.3
  9. 局部描述特征结合概率潜在语义模型的场景分类技术研究,TP391.41
  10. 影视作品对中学语文教学的影响及对策,G633.3
  11. 基于子空间学习的复杂场景多姿态人脸识别,TP391.41
  12. 在线掌纹识别算法的研究及应用,TP391.41
  13. 基于变音符号的离线阿拉伯文笔迹鉴别,TP391.41
  14. 基于视频与文本信息的说话者人脸标注,TP391.41
  15. 声乐艺术在影视作品中的应用与文化传播,J905
  16. 基于Semi-CCA的自动图像标注研究,TP391.41
  17. 汽车驾驶员疲劳驾驶预警装置设计及实验研究,U491.6
  18. 兵团影视作品与兵团文化研究,E223
  19. 数字影视作品的创意表现研究,J905
  20. 网络影视作品侵权判定案例研究,D923.41
  21. 影视作品与大学生思想道德教育研究,G641

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com