学位论文 > 优秀研究生学位论文题录展示
X10语言机制研究和实现优化
作 者: 史建国
导 师: 王戟
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 并行编程 X10 循环优化 并行递归
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 54次
引 用: 0次
阅 读: 论文下载
内容摘要
随着多核处理器越来越成为微处理器发展的主流,并行编程越来越受到人们的关注。如何在目前的多核处理器上进行简单高效的并行程序设计以利用多核所带来的性能优势成为了研究的热点。传统的并行编程语言(如OpenMP、MPI、多线程库等)都只是用于解决某一些领域的问题,并且多数并行编程语言编程复杂,描述层次相对较低,致使并行应用的开发效率低下,不适合于进行并行开发的推广。为了更好地利用和推广并行,新型的并行编程模型和并行编程语言相继出现。本文选择IBM开发的X10语言作为研究对象。X10语言是IBM在美国DARPA的HPCS(High Productivity Computing Systems)项目中开发的一种新型的面向对象的并行编程语言。它的主要目的是降低并行编程的难度,提高应用开发的效率,并提供高性能、可移植和健壮性的支持。本文的主要工作如下:1、研究X10的语言机制。将X10语言与主流的并行编程语言(OpenMP、MPI等)、其他HPCS语言和新型的Go语言进行了比较分析,指出X10语言存在的部分问题。2、X10语言的运用。运用X10语言实现跟踪界面活动网格法YGX程序,对实现的程序进行正确性的验证,并将X10语言实现的YGX程序与OpenMP版本的YGX程序进行实现及性能上的比较。3、对X10语言的优化。设计并实现基于程序特性的循环展开因子确定算法,实现了循环展开的循环优化。实验表明:经过优化后的X10语言的YGX程序性能提高大约10%。4、针对X10语言的并行递归程序,在并行度较高时,X10派生的activity过多致使程序的并行性得不到很好实现的问题,通过限制activity的派生来降低activity的派生开销对程序性能的影响,并通过计算斐波那契数的程序进行了模拟。实验表明:限制activity的派生数目确实能够提高程序性能。
|
全文目录
相似论文
- 基于多核的数据并行编程平台的研究与实现,TP332
- 自适应混合高斯背景建模算法的GPU并行优化研究,TP391.41
- 面向Cilk的并行递归程序优化技术研究,TP338.6
- 基于OpenMP的运动目标跟踪算法并行化研究,TP391.41
- OpenMP并行编程模型与性能优化方法的研究及应用,TP311.11
- 基于MapReduce的并行决策树分类算法研究与实现,TP311.13
- 基于LLVM的NiosⅡ处理器后端快速移植及优化,TP368.1
- 基于共享资源声明的并发访问控制研究与实现,TP311.1
- 燃蒸联合循环底循环性能研究,TM621
- 并行遗传算法骨架的研究与实践,TP18
- 基于骨架的并行编程环境中结构骨架库的研究,TP311.11
- 基于MapReduce的科学计算应用性能分析与优化,TP338.6
- 基于嵌入式多核系统的H.264编器实现,TN919.81
- 云计算中的MapReduce并行编程模式研究,TP338.6
- Web信息系统中几个关键技术的研究与应用,TP393.09
- 基于MPI的可视化并行程序开发平台的研究与实现,TP311.52
- 基于CPU-GPU异构平台的性能优化及多核并行编程模型的研究,TP311.1
- 减少推测多线程回退的片上网络优化设计与分析,TN47
- 基于CMP集群的并行编程模型的研究与应用,TP338.6
- 基于多核技术的有限元碰撞模拟及优化,O241.82
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|