Об одном подходе к моделированию суперкомпьютерных комплексов

Павел Артёмович Швец, Вадим Владимирович Воеводин, Сергей Игоревич Соболев

Аннотация


В НИВЦ МГУ предложен подход к созданию системы контроля автономного функционирования суперкомпьютерных комплексов на основе графовой модели суперкомпьютера. С использованием данного подхода была реализована система контроля Octotron, которая сейчас проходит апробацию в суперкомпьютерном центре МГУ. Данная статья описывает проблемы и задачи, с которыми столкнулись авторы при реализации данной системы и её запуске на суперкомпьютерах "Чебышёв" и "Ломоносов". Рассматриваются выбранные и разработанные авторами программные инструменты для работы с графами, кратко описывается язык, используемый для описания модели, затрагиваются вопросы визуализация модели и импорта данных мониторинга.


Ключевые слова


суперкомпьютер;модель суперкомпьютера;мониторинг;инструменты программирования;автономное функционирование;надежность

Полный текст:

PDF

Литература


Антонов, А.С., Воеводин, В.В., Воеводин, Вад.В.. Разработка принципов построения и реализация прототипа системы обеспечения оперативного контроля и эффективной автономной работы суперкомпьютерных комплексов / А.С. Антонов, В.В. Воеводин, В.В. Воеводин и др. // Вестник УГАТУ. — 2014. — Т. 18, № 2. — С. 227–236.

M. Bastian, S. Heymann, M. Jacomy. Gephi: an open source software for exploring and manipulating networks. / M. Bastian, S. Heymann, M. Jacomy. // International AAAI Conference on Weblogs and Social Media. — 2009.

B. Pinaud, G. Melançon, J. Dubois. PORGY: A Visual Graph Rewriting Environment for Complex Systems. / B. Pinaud, G. Melançon, J. Dubois. // Computer Graphics Forum - Eurographics Conference on Visualization (EuroVis 2012) special issue. — 2012. —Vol. 31. —P. 1265-1274.

URL: http://www.boost.org/doc/libs/1_55_0/libs/graph/doc/index.html

URL: http://graph-tool.skewed.de/

URL: http://www.neo4j.org/

Gray, J. The Transaction Concept: Virtues and Limitations. / J. Gray. // Proceedings of the 7th International Conference on Very Large Databases. — 1981. — P. 144—154.

URL: http://www.antlr.org/

URL: http://www.python.org

URL: http://www.jython.org/

URL: http://parallel.ru/cluster/skif_msu.html

URL: http://parallel.ru/cluster/lomonosov.html

URL: https://github.com/srcc-msu/octotron_core

URL: https://github.com/srcc-msu/octotron

Воеводин, Вад.В., Стефанов, К.С. Автоматическое определение и описание сетевой инфраструктуры суперкомпьютеров / В.В. Воеводин, К.С. Стефанов // Вычислительные методы и программирование: Новые вычислительные технологии (Электронный научный журнал). — 2014. — Т. 15, № 3. — С. 560–568.




DOI: http://dx.doi.org/10.14529/cmse150103