学位论文 > 优秀研究生学位论文题录展示

基于文本聚类的P2P流媒体特征码提取技术研究

作 者: 李佳
导 师: 李芝棠
学 校: 华中科技大学
专 业: 信息安全
关键词: 对等网络流媒体 文本聚类 特征码提取与分类 k-平均算法
分类号: TN919.8
类 型: 硕士论文
年 份: 2009年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


把P2P技术引入到流媒体传输中而形成了P2P流媒体技术。在这种技术中,流媒体用户不只是下载媒体流,而且还把媒体流上载给其他用户。但是对于宽带运营商,这些P2P软件占用带宽很大,为了保障其他用户的正常使用,运营商需要投入大量的资金用于网络建设。因此,研究当前流行的与未知的P2P多媒体流的特征,并对其进行特征码的提取与分类,成为亟待解决的问题之一。目前,对于P2P技术的研究和应用都进行得如火如荼,尤其是文件共享型的P2P应用,但是对于P2P流媒体检测技术的研究却很少。基于这种现状,本文做的工作,主要内容有以下几点。提出采用基于统计的方法对P2P流媒体进行特征码的提取,然后对提取出的特征码采取文本聚类的方式进行归类,着重讨论如何运用文本聚类的方式对提取出的特征码进行归类的问题。主要探讨了文本聚类的三大步骤:文本预处理、特征抽取和聚类算法。文本预处理这一模块,采用适合本实验的基于统计的Hash算法,对字符串进行固定长度的切分,运用三次求字符串的Hash值来避免字符串不同,而Hash值相同的冲突,成功提取特征字符串。然后,对文本文档进行字符串频率统计,并选择一个较合适的阈值来进行特征的抽取。最后,分析适合本系统的聚类算法,讨论了基于划分的方法和基于层次的方法,分别对这两种方法的优缺点以及适用范围作出了详细的比较,找出了适合本系统的聚类算法——k-平均算法。设计了一个P2P流媒体的特征码提取以及分类的系统,把文本聚类的技术成功应用到对P2P流量的特征字符串的分类中,并通过实验验证了算法的可行性。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-13
  1.1 研究背景  8-9
  1.2 国内外研究现状  9-11
  1.3 主要研究内容和研究目的  11-12
  1.4 本文的组织结构  12-13
2 P2P 流媒体技术概述  13-22
  2.1 P2P 流媒体系统播送方式  13-14
  2.2 P2P 应用研究的分类  14-16
  2.3 P2P 流媒体的组织结构  16-18
  2.4 P2P 流媒体的核心技术  18-20
  2.5 P2P 流媒体的发展  20-21
  2.7 本章小结  21-22
3 基于文本聚类的特征提取算法分析  22-35
  3.1 文本聚类定义及步骤  22-24
  3.2 文本聚类的重点技术  24-29
  3.3 基于文本聚类的特征提取算法研究  29-34
  3.4 本章小结  34-35
4 系统的设计与实现  35-47
  4.1 系统实验的准备工作  35-42
  4.2 聚类算法设计  42-46
  4.3 本章小结  46-47
5 系统测试与结果分析  47-55
  5.1 系统的实验环境  47
  5.2 系统测试的模块  47-53
  5.3 本章小结  53-55
6 总结与展望  55-57
  6.1 总结  55
  6.2 展望  55-57
致谢  57-58
参考文献  58-60

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 演化聚类算法及其应用研究,TP311.13
  3. 军队现役干部考核信息系统的设计与实现,TP311.52
  4. 聚类分析方法在学生信息管理系统中的应用,TP315
  5. 面向海量数据的云存储系统实现与应用研究,TP333
  6. 煤矿安全检测系统中甲烷气体检测仪的研制,TP216
  7. 基于模式识别和数据挖掘的铝工业生产节能降耗研究,TP391.41
  8. VAR综合多业务光传输交换系统的设计,TN929.1
  9. 基于LabVIEW的心音信号发生器和多功能处理仪器的研究,TH772
  10. 基于Vague集的网络舆情研究,TP393.09
  11. 网状—拉式对等流媒体系统分布式激励机制研究,TN919.8
  12. 改进的模糊C-均值算法在文本聚类中的应用研究,TP391.1
  13. 基于k-means的中文文本聚类算法的研究与实现,TP391.1
  14. 机器学习算法在文本分析中的研究,TP181
  15. 关于互联网文本数据挖掘的一些关键技术研究,TP311.13
  16. 针对确定话题的离散文本舆情聚类与可视化研究,TP391.1
  17. P2P流媒体系统数据调度机制研究,TN919.8
  18. 基于Map-Reduce构建高效文本聚类系统,TP391.1
  19. 支持多语言标签优先的元搜索引擎结果聚类研究,TP391.3
  20. 基于近邻传播和凝聚层次的文本聚类方法,TP391.1

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信
© 2012 www.xueweilunwen.com