Octoshell: система для администрирования больших суперкомпьютерных комплексов

Дмитрий Александрович Никитенко, Владимир Валентинович Воеводин, Сергей Анатольевич Жуматий

Аннотация


Управление современными суперкомпьютерными центрами и входящими в их состав вычислительными системами представляет собой сложный и комплексный процесс. Традиционное использование многочисленных инструментов для решения отдельных задач по управлению и администрированию суперкомпьютеров становится ограничивающим фактором эффективного использования вычислительных ресурсов при растущих масштабах систем. Разработанная система поддержки работы суперкомпьютерных центров «Octoshell» призвана решить указанную проблему, реализуя в едином интерфейсе основные инструменты администрирования, и позволяет в значительной мере автоматизировать выполнение типовых задач обеспечения эффективного функционирования больших суперкомпьютерных комплексов.

Ключевые слова


суперкомпьютер, мониторинг, управление суперкомпьютерным центром, администрирование суперкомпьютеров, система поддержки пользователей

Полный текст:

PDF

Литература


Топ50 Суперкомпьютеры URL: http://top50.supercomputers.ru (дата обращения: 02.08.2015).

Top500 Supercomputer sites URL: http://top500.org (дата обращения: 02.08.2015).

Воеводин, Вл.В. Практика суперкомпьютера «Ломоносов» / Воеводин Вл.В., Жума-тий С.А., Соболев С.И., Антонов А.С., Брызгалов П.А., Никитенко Д.А., Стефанов К.С., Воеводин Вад.В.// Открытые системы. — 2012. — № 7. — С. 36–39.

Никитенко, Д.А. Подход к гибкому управлению суперкомпьютерами / Жуматий С.А., Никитенко Д.А. // Научный сервис в сети Интернет: все грани параллелизма: Труды Международной суперкомпьютерной конференции (Новороссийск, 23–28 сентября 2013г.) — г.Москва, Изд-во МГУ, — 2013, — С. 296-300.

Жуматий, С.А. Администрирование суперкомпьютеров и кластерных систем / Жу-матий С.А., Дацюк О.В. // — Москва, Изд-во МГУ, 2014. — С. 400.

Torgue batch system URL: http://www.adaptivecomputing.com/products/open-source/torque/ (дата обращения: 02.08.2015).

SLURM workload manager URL: http://slurm.schedmd.com/ (дата обращения: 02.08.2015).

OpenPBS URL: http://www.mcs.anl.gov/research/projects/openpbs/ (дата обращения: 02.08.2015).

Ganglia Monitoring System URL: http://ganglia.sourceforge.net/ (дата обращения: 02.08.2015).

Zabbix monitoring URL: http://www.zabbix.com/ru/ (дата обращения: 02.08.2015).

Nagios monitoring URL: https://www.nagios.org/ (дата обращения: 02.08.2015).

Open-source Ticket Request System URL: http://www.otrs.org/ (дата обращения: 02.08.2015).

Леоненков, С.Н. Расширение функциональности менеджера ресурсов суперкомпьютера SLURM / Леоненков С.Н. // Научный сервис в сети Интернет: многообразие суперкомпьютерных миров: Труды Международной суперкомпьютерной конферен-ции (Новороссийск, 22–27 сентября 2014г.), — Москва, Изд-во МГУ, — 2014, — С. 472-476.

Никитенко, Д.А. Комплексный анализ производительности суперкомпьютерных систем, основанный на данных системного мониторинга / Никитенко Д.А. // Вычис-лительные методы и программирование: Новые вычислительные технологии (Электронный научный журнал). — 2014. — Том 15. — C. 85–97.

Никитенко, Д.А. Исследование динамических характеристик потока задач супер-компьютерной системы / Антонов А.С., Жуматий С.А., Никитенко Д.А., Стефанов К.С., Теплов А.М., Швец П.А. // Вычислительные методы и программирование: Но-вые вычислительные технологии (Электронный научный журнал). — 2013. Том 14(2), — С. 104-108.

Стефанов, К.С. Система мониторинга производительности суперкомпьютеров / Стефанов К.С. // Вестник Пермского Национального исследовательского политех-нического университета. Аэрокосмическая техника. — 2014. — № 39. — С. 17–34.

Воеводин, Вл.В. Ситуационный экран суперкомпьютера / Воеводин Вл.В. // Откры-тые системы, — 2014. — № 3, — С. 36-39.

Никитенко, Д.А. Обеспечение оперативного контроля и эффективной автономной работы Суперкомпьютерного комплекса МГУ / Антонов А.С., Воеводин Вад В., Дау-гель-Дауге А.А., Жуматий С.А., Никитенко Д.А., Соболев С.И., Стефанов К.С., Швец П.А. // Вестник Южно-Уральского государственного университета. Серия Вычисли-тельная математика и информатика. — 2015. — Том 4(2), — С. 33–43.




DOI: http://dx.doi.org/10.14529/cmse160306