学位论文 > 优秀研究生学位论文题录展示
基于GPU的数据流通用处理模型
作 者: 郑杨杨
导 师: 周勇
学 校: 大连理工大学
专 业: 计算机应用技术
关键词: 数据流 GPU并行计算 通用处理模型 软件体系结构 k-means
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 17次
引 用: 0次
阅 读: 论文下载
内容摘要
数据流是一种新的数据形态。许多应用中会连续不断产生大量随时间演变的序列型数据,构成时间序列数据流,如传感器网络、实时股票行情、网络及通信监控等场合。数据挖掘是分析这类并行多数据流的一种有力工具。但由于数据流长度无限、随时间演变、持续到达、速度快和纬度高的特点,使得传统的数据挖掘方法无法直接应用,于是就出现了一种新的技术——流数据挖掘,也叫数据流挖掘。流数据的这种特殊性使得处理起来困难重重。流数据挖掘的确可以处理数据流,然而,也出现了前所未有的挑战。主要的挑战是被空间(内存)和时间的有限资源所制约的“数据密集型”挖掘。我们需要考虑的第一个根本问题就是如何优化挖掘算法所消耗的内存空间。另一个问题就是如何在最短的时间内完成对数据的处理,以满足数据流处理的实时性。目前这两个问题还没有很好的解决方法。本文主要研究的是GPU并行计算在数据流挖掘领域的应用,特别是高维时间序列数据流的高性能处理问题。在计算资源受限的环境下,为了保证数据流处理的实时性和通用性,本文结合GPU并行计算和CUDA架构,提出了一种基于GPU的数据流通用处理模型。该通用模型适合于各个应用领域的多条高维时间序列数据流,它涵盖了数据流的预处理、减负、概要抽取和挖掘处理等多项功能,能完成数据流处理时的多项任务,如查询处理、聚类、分类、频繁项集挖掘等。本文以k-means聚类算法为例,详细描述了模型中核心区的技术实现。最后,还给出了模型的软件体系结构描述,包括以UML为代表的可视化描述和以ADL为代表的形式化描述,本文采用UML和ADL相结合的方法来描述系统的体系结构。经理论分析和实验验证,该模型有较好的通用性和高效性,又降低了I/0开销,可广泛应用于数据流挖掘领域。
|
全文目录
摘要 4-5 Abstract 5-9 引言 9-10 1 数据流和图形处理器 10-21 1.1 数据流简介 10-13 1.1.1 产生背景 10-11 1.1.2 数据流模型 11 1.1.3 概要数据结构 11-12 1.1.4 数据流处理 12-13 1.2 GPU和CUDA架构 13-17 1.2.1 GPU发展史 13-15 1.2.2 GPU通用并行计算 15 1.2.3 CUDA编程模型 15-17 1.3 GPU处理数据流的优势和研究现状 17-19 1.3.1 流数据挖掘的难点 17-18 1.3.2 GPU处理数据流的优势 18 1.3.3 GPU处理数据流的研究现状 18-19 1.4 软件体系结构 19-20 1.4.1 简介 19 1.4.2 核心模型 19-20 1.5 章节安排 20-21 2 GPU上数据流通用处理模型架构 21-25 2.1 总体架构 21-23 2.2 通用处理过程 23-24 2.3 模型特点 24 2.4 本章小结 24-25 3 通用处理模型的核心区技术实现 25-40 3.1 数据流预处理区 25-26 3.2 减轻负荷区 26-27 3.3 CPU端加载引擎区 27-28 3.4 GPU端缓冲区 28-30 3.5 数据流概要抽取区 30-34 3.6 数据流处理模型库 34-37 3.7 数据流处理区 37-38 3.8 本章小结 38-40 4 模型的软件体系结构描述 40-48 4.1 系统的体系结构 40-41 4.2 基于UML的可视化描述 41-44 4.2.1 类图 41-43 4.2.2 构件图 43-44 4.3 基于ADL的形式化描述 44-46 4.4 本章小结 46-48 5 实验 48-56 5.1 实验设置 48-49 5.2 k-means算法 49-51 5.3 对比的CPU程序 51-53 5.4 结果分析 53-55 5.5 本章小结 55-56 结论 56-57 参考文献 57-61 攻读硕士学位期间发表学术论文情况 61-62 致谢 62-63
|
相似论文
- K-means聚类优化算法的研究,TP311.13
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于机器视觉的车辆检测和车距测量方法研究,TP274
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
- 一种多数据流聚类异常检测算法,TP311.13
- 基于数据流异常检测的嵌入式软件容错研究,TP368.1
- 应用于搜索引擎的人物分类系统设计与实现,TP391.3
- 面向短消息文本的聚类技术研究与应用,TP391.1
- 基于RFID数据流的基本事件实惠查询处理与优化,TP311.13
- 伺服压力机上位机控制及工艺规划软件的研究,TP273
- C电信公司中高端移动用户套餐适配研究,F626
- 云存储系统高效数据传输机制的研究,TP333
- 网间加速技术研究与实现,TP393.2
- K-means算法在网店代购点选择中的应用研究,F224
- 安全相关软件的设计方法研究及应用,TP311.52
- 高校图书馆管理系统的个性化服务的设计与实现,TP311.52
- 基于混合软件体系结构模型的电厂SIS,TP311.52
- 基于GPU的时间序列并行检索算法研究,TP391.41
- 基于CPU的源强反算算法研究,TP18
- 软件体系结构自适应模型及其智能化研究,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|