学位论文 > 优秀研究生学位论文题录展示

人脸表情识别及其在视频分类与推荐中的应用

作 者: 赵思成
导 师: 姚鸿勋
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 人脸表情识别 情感计算 视频分类与推荐 空间特征 隐动态条件随机场
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 79次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着智能接口和人机交互技术的迫切需求和快速发展,以人脸表情识别为主的情感计算成为新的研究热点。人脸表情识别能够增强人机交互的智能性和友好性,具有重要的科研价值和应用价值。另外,随着数码照相机、摄像机的广泛使用和多媒体共享网络(如YouTube)的快速发展,网络视频的数量正呈海量增长,如何从观察者的情感角度高效准确的对这些视频进行分类与推荐对于网站管理和增强用户体验变得至关重要。本文在总结国内外人脸表情识别及视频分类与推荐研究现状的基础上,分析了现有研究存在的问题与缺陷,提出了一种基于空间特征和隐动态条件随机场的表情识别方法,并且以此为基础,从观察者表情识别的情感角度对视频进行分类与推荐,取得了良好的效果。具体的研究工作如下:首先,对表情图像进行预处理,本文提出了一种基于人脸检测的眼睛定位算法,以定理的形式给出了图像旋转前后坐标的对应关系并进行了证明。在检测到人脸之后,采用形态学滤波与求区域中心相结合的方法对眼睛进行精确定位。接着对表情图像进行尺度归一化和灰度归一化操作,为后续操作奠定了基础。其次,本文提出了一种基于空间特征和隐动态条件随机场的表情识别方法。首先把构造组合Haar特征的过程嵌入到改进的AdaBoost算法中,提取出表情的空间特征。然后提出了一种新的图模型—隐动态条件随机场,它结合了隐条件随机场和动态条件随机场的优点。采用最大似然估计的方法对其参数进行估计,并且把它与已有的概率模型进行了比较。接着通过把空间特征嵌入到隐动态条件随机场中,即把时间特征和空间特征结合起来,对人脸表情进行识别,在Cohn-Kanade数据库上的实验证明了算法的有效性和准确性。最后,根据提出的表情识别方法,对观察者观看视频的表情进行识别,构造出他们的情感曲线,根据已有的心理学及电影学研究基础,对视频进行分类与推荐。通过表情的变化次数及规律,给出了视频类别及推荐分数。在我们收集的数据库上进行实验,效果良好,绝大多数观察者对视频类别及推荐分数的结果是满意的。文章最后总结了本文的主要工作和存在的不足,并且对该领域未来的发展趋势进行了展望。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-21
  1.1 课题的研究背景及意义  9-10
  1.2 人脸表情识别研究现状  10-15
    1.2.1 表情图像预处理  11-12
    1.2.2 人脸表情特征的提取  12-13
    1.2.3 表情的分类与识别  13
    1.2.4 表情数据库  13-15
  1.3 视频分类与推荐研究现状  15-18
    1.3.1 用于视频分类的特征  16-17
    1.3.2 视频分类方法  17-18
    1.3.3 视频推荐常用方法  18
  1.4 技术难点及存在问题  18-19
  1.5 论文的研究内容及组织结构  19-21
第2章 人脸表情图像预处理  21-32
  2.1 人脸检测  21-22
  2.2 人眼定位  22-25
    2.2.1 定位预处理  22-23
    2.2.2 形态学滤波  23-24
    2.2.3 人眼精确定位  24-25
  2.3 尺度归一化  25-29
    2.3.1 图像旋转前后坐标对应关系的推导及定理证明  26-28
    2.3.2 具体操作  28-29
  2.4 灰度归一化  29-31
  2.5 本章小结  31-32
第3章 空间特征的情感表达与计算  32-42
  3.1 Haar 特征  32-34
  3.2 积分图像  34-35
  3.3 空间Haar 特征的情感表达与计算  35-38
    3.3.1 局部块  35-36
    3.3.2 构造空间特征算法  36-37
    3.3.3 改进的AdaBoost 学习算法  37-38
  3.4 空间特征实验  38-41
    3.4.1 实验数据  38-39
    3.4.2 实验结果及分析  39-41
  3.5 本章小结  41-42
第4章 基于隐动态条件随机场的表情序列识别  42-51
  4.1 隐动态条件随机场的定义  42-43
  4.2 参数估计  43
  4.3 隐动态条件随机场与以往概率模型的比较  43-48
  4.4 表情序列识别实验  48-50
    4.4.1 实验数据  48
    4.4.2 实验结果及分析  48-50
  4.5 本章小结  50-51
第5章 基于观察者表情识别的视频分类与推荐  51-58
  5.1 观察者表情识别  51-52
  5.2 情感曲线  52-53
  5.3 视频分类与推荐  53-54
  5.4 视频分类与推荐实验  54-57
    5.4.1 实验数据  54
    5.4.2 实验结果及分析  54-57
  5.5 本章小结  57-58
结论  58-60
参考文献  60-65
攻读硕士学位期间发表的论文及其它成果  65-67
致谢  67-68

相似论文

  1. 江苏省典型区域农村地表水环境现状空间分析及污染评价,S271
  2. 基于脑波的情感图像检索的研究,TP391.41
  3. 天津原英租界区形态演变与空间解析,TU984.113
  4. 基于Gabor小波与神经网络的人脸表情识别研究,TP391.41
  5. 基于时空特征的福建省滨海地区旅游客源市场研究,F224
  6. Lorentz空间的相关讨论,O174.2
  7. 长沙太平街建筑空间环境研究,TU-024
  8. 基于LPP算法的人脸识别技术研究,TP391.41
  9. 基于EHMM的表情识别研究,TP391.41
  10. 现象学视角下的成都平原林盘价值研究,TU-0
  11. 人脸表情识别方法的分析与研究,TP391.41
  12. 基于模糊支持向量机的彩色图像分割,TP391.41
  13. 基于独立成分分析的人脸表情识别算法研究,TP391.41
  14. 波束域特征空间波束形成及其方向图低旁瓣实现,TN911.7
  15. 基于空间特征码的矢量要素变化检测研究,P208
  16. 基于视觉的家庭服务机器人的情感认知研究,TP242
  17. 基于仿生特征的人脸表情识别,TP391.4
  18. 基于语音信号的情绪识别研究,TN912.34
  19. 基于语义搭配的评论倾向性分析,TP391.1
  20. Gabor小波变换与表情组合模板相结合的表情识别研究与实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com