Распараллеливание тестов NAS NPB для сопроцессора Intel Xeon Phi на языке Fortran-DVMH

Валерий Федорович Алексахин
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук

Владимир Александрович Бахтин
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук

Ольга Федоровна Жукова
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук

Александр Сергеевич Колганов
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук

Виктор Алексеевич Крюков
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук

Ирина Петровна Островская
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук

Наталия Викторовна Поддерюгина
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук

Михаил Николаевич Притула
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук

Ольга Антониевна Савицкая
Федеральное государственное бюджетное учреждение науки Институт прикладной математики им. М.В. Келдыша Российской академии наук


Аннотация


В статье анализируется эффективность выполнения тестов NAS из пакета NPB 3.3.1 (EP, MG, BT, SP, LU) на узлах кластеров различной архитектуры, использующих многоядерные универсальные процессоры, графические ускорители фирмы NVidia и сопроцессоры фирмы Intel. Сравниваются характеристики тестов, разработанных на высокоуровневом языке Fortran-DVMH (далее FDVMH), и их реализации на других языках. Исследуется влияние различных оптимизаций для FDVMH-версий тестов NAS, необходимых для их эффективной работы на сопроцессоре Intel Xeon Phi. Представлены результаты запусков тестов при одновременном использовании всех ядер центрального процессора, графического процессора и сопроцессора Intel Xeon Phi.

Ключевые слова


DVMH; высокоуровневый язык программирования; ускоритель; сопроцессор; графический процессор; тесты NAS; Фортран

Полный текст:

PDF

Литература


Top500 List — November 2014. URL: http://top500.org/list/2014/11/ (дата обращения 01.04.2015).

High Performance Fortran. URL: http://hpff.rice.edu (дата обращения 01.04.2015).

Коновалов, Н.А. Fortran DVM — язык разработки мобильных параллельных про-грамм / Н.А. Коновалов, В.А. Крюков, С.Н. Михайлов, А.А. Погребцов // Программирование. — 1995. — № 1. — C. 49–54.

Коновалов, Н.А. С-DVM — язык разработки мобильных параллельных программ / Н.А. Коновалов, В.А. Крюков, Ю.Л. Сазанов // Программирование. — 1999. — № 1. — C. 54–65.

OpenACC. URL: http://www.openacc-standard.org/ (дата обращения 01.04.2015).

OpenMP 4.0 Specifications. URL: http://openmp.org/wp/openmp-specifications/ (дата обращения 01.04.2015).

Архитектура Intel Ivy Bridge-EP. URL: http://www.intel.ru/content/www/ru/ru/secure/intelligent-systems/privileged/ivy-bridge-ep/xeon-e5-1600-2600-v2-bsdl.html (дата обращения 30.11.2014).

Архитектура Intel MIC. URL: https://software.intel.com/mic-developer (дата обращения 01.04.2015).

Архитектура Nvidia Kepler. URL: http://www.nvidia.com/content/PDF/kepler/NVIDIA-kepler-GK110-Architecture-Whitepaper.pdf (дата обращения 01.04.2015).

NAS Parallel Benchmarks. URL: http://www.nas.nasa.gov/publications/npb.html (дата обращения 01.04.2015).

Бахтин, В.А. Расширение DVM-модели параллельного программирования для кластеров с гетерогенными узлами / В.А. Бахтин, М.С. Клинов, В.А. Крюков, Н.В. Поддерюгина, М.Н. Притула, Ю.Л. Сазанов // Вестник Южно-Уральского государственного университета. Серия: «Математическое моделирование и программирование». — 2012. — № 18(277). — C. 82–92.

Intel Xeon Phi programming environment URL: https://software.intel.com/en-us/articles/intel-xeon-phi-programming-environment (дата обращения 01.04.2015).

Алексахин, В.Ф. Распараллеливание на графические процессоры тестов NAS NPB3.3.1 на языке Fortran DVMH / В.Ф. Алексахин, В.А. Бахтин, О.Ф. Жукова, А.С. Колганов, В.А. Крюков, Н.В. Поддерюгина, М.Н. Притула, О.А. Савицкая, А.В. Шуберт // Вестник Уфимского государственного авиационного технического университета.— 2015. — Т. 19, № 1(67). — C. 240–250.

Ramachandran, A. Performance Evaluation of NAS Parallel Benchmarks on Intel Xeon Phi / A. Ramachandran, J. Vienne, R. Wijngaart, L. Koesterke, I. Sharapov // Proceedings of the 42nd International Conference on Parallel Processing. — 2013. — P. 736–743. DOI: 10.1109/icpp.2013.87.




DOI: http://dx.doi.org/10.14529/cmse150403