学位论文 > 优秀研究生学位论文题录展示

Web视频资源的智能发现关键技术研究

作 者: 李锐鑫
导 师: 叶允明
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: Web视频资源 特征选择 特征知识库 增量学习
分类号: TP393.092
类 型: 硕士论文
年 份: 2010年
下 载: 32次
引 用: 0次
阅 读: 论文下载
 

内容摘要


信息技术的迅猛发展,特别是Web 2.0普及后用户参与度的大幅度提高,用户不仅可以在线欣赏视频,还可以成为网络视频资源的提供者,所以Internet的视频资源急剧增加,Web视频资源的搜索与监控成为一个亟待解决的问题。本文围绕着如何在实际网络环境中快、准、全的搜索出视频资源的需求,在深入研究爬虫的工作原理的基础上,提出基于动态Web视频资源特征库的视频资源疑似度评估模型,设计在线增量学习算法以动态调整和丰富视频资源特征知识库。然后经过不断进行优化和改进,从而较大幅度地提升系统的运行效率,最终达到可实际运用的性能。本文的主要成果可以归纳为以下几个方面:(1)对实际网络视频资源特征与分布进行深入调研,通过分析已知的Web视频节目特征,提取其中可以用于评估一个页面视频节目疑似度的特征线索,并设计这种特征的表示模型,最终形成一个Web视频特征知识基础库。(2)在对爬虫技术深入研究的基础上,借鉴了主题爬虫设计思路,结合在Web上发现视频资源的静态爬行模型,提出了基于在线增量学习的视频资源发现模型,并进一步设计了具备更高性能的Web视频发现改进模型,并基于该模型,提出了一种基于增量学习的视频资源发现算法。(3)通过对实际性能的考察和调优,针对提出的视频资源发现模型,设计了大量可以控制的配置参数,并通过调研、实验对比,给出了实际操作中可以使用的参数范围。(4)基于上述的理论研究成果,设计了具体的视频资源发现系统的体系结构和各个模块的具体流程,形成一个高性能Web视频只能发现系统的详细设计,并最终实现成为可实际运用的系统。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-20
  1.1 课题研究背景和意义  10-13
    1.1.1 课题来源  10
    1.1.2 研究的背景与意义  10-13
  1.2 国内外相关研究和综述  13-18
    1.2.1 国内外主题爬虫研究现状  14-17
    1.2.2 现有主题爬虫的比较以及缺陷  17-18
  1.3 课题研究内容  18-19
  1.4 本文的结构安排  19-20
第2章 Web 视频资源智能发现的相关基础知识  20-24
  2.1 Web 视频资源发现的基本概念  20-21
    2.1.1 Web 视频资源  20
    2.1.2 Web 视频资源爬虫  20-21
  2.2 机器学习基本方法  21-23
    2.2.1 机械学习  21-22
    2.2.2 示教学习  22
    2.2.3 演绎学习  22
    2.2.4 类比学习  22
    2.2.5 解释学习  22
    2.2.6 归纳学习  22-23
  2.3 本章小结  23-24
第3章 Web 视频资源分布特征分析和特征知识库表示方法  24-35
  3.1 Web 视频资源分布特征  24-25
  3.2 Web 视频资源发现线索  25-30
    3.2.1 后缀格式  25-26
    3.2.2 URL 协议  26-28
    3.2.3 页面关键代码  28-29
    3.2.4 页面关键词  29
    3.2.5 URL 模式  29-30
  3.3 Web 视频资源特征库的定义与使用  30-34
    3.3.1 Web 视频资源特征库的定义  30
    3.3.2 Web 视频资源特征库的使用  30-32
    3.3.3 实验结果及分析  32-34
  3.4 本章小结  34-35
第4章基于在线增量学习的Web 视频资源发现算法  35-49
  4.1 Web 视频资源发现模型研究  35-40
    4.1.1 基于静态特征知识库的Web 视频资源发现模型  35-36
    4.1.2 在线增量学习模型定义  36-37
    4.1.3 基于在线增量学习的Web 视频资源发现模型  37-39
    4.1.4 基于在线增量学习的Web 视频资源发现改进模型  39-40
  4.2 Web 视频资源智能发现算法研究  40-44
    4.2.1 评估算法概述  40-41
    4.2.2 Web 视频资源URL 模式特征增量学习算法  41-42
    4.2.3 Web 视频资源关键词特征增量学习算法  42-44
    4.2.4 基于在线增量学习的Web 视频资源发现算法  44
  4.3 实验与分析  44-48
    4.3.1 实验数据描述  44-45
    4.3.2 评测标准  45
    4.3.3 Web 视频资源发现实验结果分析  45-48
  4.4 本章小结  48-49
第5章 Web 视频资源智能发现系统设计与实现  49-59
  5.1 系统的功能和目标  49-50
  5.2 系统总体设计  50-52
  5.3 系统详细设计  52-57
    5.3.1 用户交互UI 模块  52-53
    5.3.2 数据库交互模块  53-54
    5.3.3 网络数据采集模块  54-55
    5.3.4 信息抽取模块  55
    5.3.5 视频疑似度评估模块  55-56
    5.3.6 页面扫描策略模块  56
    5.3.7 分布式负载均衡模块  56-57
  5.4 系统运用  57-58
  5.5 本章小结  58-59
结论  59-60
参考文献  60-63
附录  63-66
致谢  66

相似论文

  1. 基于仿生模式识别的文本分类技术研究,TP391.1
  2. 唇读中的特征提取、选择与融合,TP391.41
  3. 语音情感识别的特征选择与特征产生,TP18
  4. 基于数据分布特征的文本分类研究,TP391.1
  5. 车辆识别系统动态特征选择算法的研究与实现,TP391.41
  6. 基于AdaBoost算法的人脸识别研究,TP391.41
  7. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  8. 面向三网融合的故障管理系统的研究及实现,TP315
  9. 基于群体智能的医学图像特征优化算法研究,TP391.41
  10. 基于FSVM的数据挖掘方法及其在入侵检测中的应用研究,TP393.08
  11. 流形学习的方差最小化准则,TP181
  12. 掌纹主线特征选择方法及成像系统研究,TP391.41
  13. 中国民族音乐特征提取与分类技术的研究,J607
  14. 随机森林特征选择,TP311.13
  15. 面向概念查询的生物医学多文档摘要技术研究,TP391.1
  16. 面向互联网中文舆情信息的情感倾向分析,TP391.1
  17. 基于粗糙集属性约简和加权SVM的入侵检测方法研究,TP393.08
  18. 基于决策树的网络流量分类研究,TP393.06
  19. 基于内容检索的垃圾邮件过滤器研究与实现,TP393.098
  20. 关节式物体检测识别及应用,TP391.41
  21. 基于英文博客空间文本的情感分析研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com