Octoshell: система для администрирования больших суперкомпьютерных комплексов

Дмитрий Александрович Никитенко
Московский государственный университет имени М.В. Ломоносова

Владимир Валентинович Воеводин
Московский государственный университет имени М.В. Ломоносова

Сергей Анатольевич Жуматий
Московский государственный университет имени М.В. Ломоносова


Аннотация


Управление современными суперкомпьютерными центрами и входящими в их состав вычислительными системами представляет собой сложный и комплексный процесс. Традиционное использование многочисленных инструментов для решения отдельных задач по управлению и администрированию суперкомпьютеров становится ограничивающим фактором эффективного использования вычислительных ресурсов при растущих масштабах систем. Разработанная система поддержки работы суперкомпьютерных центров «Octoshell» призвана решить указанную проблему, реализуя в едином интерфейсе основные инструменты администрирования, и позволяет в значительной мере автоматизировать выполнение типовых задач обеспечения эффективного функционирования больших суперкомпьютерных комплексов.

Ключевые слова


суперкомпьютер, мониторинг, управление суперкомпьютерным центром, администрирование суперкомпьютеров, система поддержки пользователей

Полный текст:

PDF

Литература


Топ50 Суперкомпьютеры URL: http://top50.supercomputers.ru (дата обращения: 02.08.2015).

Top500 Supercomputer sites URL: http://top500.org (дата обращения: 02.08.2015).

Воеводин, Вл.В. Практика суперкомпьютера «Ломоносов» / Воеводин Вл.В., Жума-тий С.А., Соболев С.И., Антонов А.С., Брызгалов П.А., Никитенко Д.А., Стефанов К.С., Воеводин Вад.В.// Открытые системы. — 2012. — № 7. — С. 36–39.

Никитенко, Д.А. Подход к гибкому управлению суперкомпьютерами / Жуматий С.А., Никитенко Д.А. // Научный сервис в сети Интернет: все грани параллелизма: Труды Международной суперкомпьютерной конференции (Новороссийск, 23–28 сентября 2013г.) — г.Москва, Изд-во МГУ, — 2013, — С. 296-300.

Жуматий, С.А. Администрирование суперкомпьютеров и кластерных систем / Жу-матий С.А., Дацюк О.В. // — Москва, Изд-во МГУ, 2014. — С. 400.

Torgue batch system URL: http://www.adaptivecomputing.com/products/open-source/torque/ (дата обращения: 02.08.2015).

SLURM workload manager URL: http://slurm.schedmd.com/ (дата обращения: 02.08.2015).

OpenPBS URL: http://www.mcs.anl.gov/research/projects/openpbs/ (дата обращения: 02.08.2015).

Ganglia Monitoring System URL: http://ganglia.sourceforge.net/ (дата обращения: 02.08.2015).

Zabbix monitoring URL: http://www.zabbix.com/ru/ (дата обращения: 02.08.2015).

Nagios monitoring URL: https://www.nagios.org/ (дата обращения: 02.08.2015).

Open-source Ticket Request System URL: http://www.otrs.org/ (дата обращения: 02.08.2015).

Леоненков, С.Н. Расширение функциональности менеджера ресурсов суперкомпьютера SLURM / Леоненков С.Н. // Научный сервис в сети Интернет: многообразие суперкомпьютерных миров: Труды Международной суперкомпьютерной конферен-ции (Новороссийск, 22–27 сентября 2014г.), — Москва, Изд-во МГУ, — 2014, — С. 472-476.

Никитенко, Д.А. Комплексный анализ производительности суперкомпьютерных систем, основанный на данных системного мониторинга / Никитенко Д.А. // Вычис-лительные методы и программирование: Новые вычислительные технологии (Электронный научный журнал). — 2014. — Том 15. — C. 85–97.

Никитенко, Д.А. Исследование динамических характеристик потока задач супер-компьютерной системы / Антонов А.С., Жуматий С.А., Никитенко Д.А., Стефанов К.С., Теплов А.М., Швец П.А. // Вычислительные методы и программирование: Но-вые вычислительные технологии (Электронный научный журнал). — 2013. Том 14(2), — С. 104-108.

Стефанов, К.С. Система мониторинга производительности суперкомпьютеров / Стефанов К.С. // Вестник Пермского Национального исследовательского политех-нического университета. Аэрокосмическая техника. — 2014. — № 39. — С. 17–34.

Воеводин, Вл.В. Ситуационный экран суперкомпьютера / Воеводин Вл.В. // Откры-тые системы, — 2014. — № 3, — С. 36-39.

Никитенко, Д.А. Обеспечение оперативного контроля и эффективной автономной работы Суперкомпьютерного комплекса МГУ / Антонов А.С., Воеводин Вад В., Дау-гель-Дауге А.А., Жуматий С.А., Никитенко Д.А., Соболев С.И., Стефанов К.С., Швец П.А. // Вестник Южно-Уральского государственного университета. Серия Вычисли-тельная математика и информатика. — 2015. — Том 4(2), — С. 33–43.




DOI: http://dx.doi.org/10.14529/cmse160306