Отображение на кластеры с графическими процессорами DVMH-программ с регулярными зависимостями по данным.

Владимир Александрович Бахтин
Институт прикладной математики им. М.В. Келдыша РАН

Александр Сергеевич Колганов
Институт прикладной математики им. М.В. Келдыша РАН

Виктор Алексеевич Крюков
Институт прикладной математики им. М.В. Келдыша РАН

Наталия Викторовна Поддерюгина
Институт прикладной математики им. М.В. Келдыша РАН

Михаил Николаевич Притула
Институт прикладной математики им. М.В. Келдыша РАН


Аннотация


В 2011 г. для новых гетерогенных и гибридных суперкомпьютерных систем в Институте прикладной математики им. М.В. Келдыша РАН была предложена модель DVMH (DVM for Heterogeneous systems), разработаны языки программирования высокого уровня, представляющие собой стандартные языки Фортран и Си, расширенные директивами отображения программы на параллельную машину, оформленными в виде специальных комментариев (или прагм). В статье описываются проблемы и методы отображения циклов с зависимостями на графические процессоры, демонстрируется эффективность разработанных на языке Fortran DVMH параллельных программ с регулярными зависимостями по данным.

Ключевые слова


DVM for Heterogeneous systems; Fortran DVMH; гибридные системы с ускорителями; графические процессоры; CUDA

Полный текст:

PDF

Литература


Top500 List – November 2012 TOP500 Supercomputer Sites. URL: http://top500.org/list/2012/11/ (дата обращения 01.12.2012).

High Performance Fortran. URL: http://hpff.rice.edu/ (дата обращения 01.12.2012).

Параллельное программирование в системе DVM. Языки Fortran-DVM и C-DVM / Н.А. Коновалов, В.А. Крюков, А.А. Погребцов и др. // Труды Международной конференции «Параллельные вычисления и задачи управления» (PACO’2001). — Москва, 2001. — С. 140–154.

Fortran DVM – язык разработки мобильных параллельных программ / Н.А. Коновалов, В.А. Крюков, С.Н. Михайлов, А.А. Погребцов // Программирование. — 1995. — № 1. — С. 49–54.

Коновалов, Н.А. C-DVM – язык разработки мобильных параллельных программ / Н.А. Коновалов, В.А. Крюков, Ю.Л. Сазанов // Программирование. — 1999. — № 1. — С. 54–65.

Dolbeau, R. HMPP™: A Hybrid Multi-core Parallel Programming Environment / R. Dolbeau, S. Bihan, F. Bodin. URL: http://www.caps-entreprise.com/wp-

content/uploads/2012/08/caps-hmpp-gpgpu-Boston-Workshop-Oct-2007.pdf (дата обращения 02.12.2012).

The Portland Group. PGI Accelerator Programming Model for Fortran & C. URL: http://www.pgroup.com/lit/whitepapers/pgi_accel_prog_model_1.3.pdf (дата обращения 02.12.2012).

OpenACC. URL: http://www.openacc-standard.org/ (дата обращения 01.12.2012).

Han, T.D. hiCUDA: High-Level GPGPU Programming / T.D. Han, T.S.Abdelrahman.// IEEE Transactions on Parallel and Distributed Systems. — 2011. — Vol.22, No. 3 — P. 78–90.

Расширение DVM-модели параллельного программирования для кластеров с гетерогенными узлами / В.А. Бахтин, М.С. Клинов, В.А. Крюков и др. // Вестник Южно-Уральского государственного университета, серия «Математическое моделирование

и программирование». — Челябинск: Издательский центр ЮУрГУ, 2012. — Вып. 12 — № 18 (277). — С. 82–92.

Pennycook, S.J. Performance Analysis of a Hybrid MPI/CUDA Implementation of the NAS-LU Benchmark / S.J. Pennycook, S.D. Hammond, S.A. Jarvis, G.R. Mudalige // ACM SIGMETRICS Performance Evaluation Review – Special issue on the 1st international workshop on performance modeling, benchmarking and simulation of high performance computing systems (PMBS 10). — 2011. — Vol. 38, Issue 4. — P. 23–29.

Seo, S. Performance Characterization of the NAS Parallel Benchmarks in OpenCL / S. Seo, G. Jo, J. Lee // 2011 IEEE International Symposium on. Workload Characterization (IISWC). — 2011. — P. 137–148.




DOI: http://dx.doi.org/10.14529/cmse130404