Параллельная СУБД с открытым исходным кодом для кластерных вычислительных систем

Евгений Владимирович Гавриш, Алексей Владимирович Колтаков, Александр Андреевич Медведев, Леонид Борисович Соколинский

Аннотация


Статья посвящена вопросам разработки параллельной СУБД с открытым исходным ко-дом для кластерных вычислительных систем. Дан обзор известных решений в этой области. Рассмотрена новая параллельная СУБД «Омега» с открытым исходным кодом, ориентиро-ванная на кластерные вычислительные системы. Приведена общая архитектура системы «Омега». Представлены диаграмма размещения и диаграмма классов. Описаны основные подсистемы СУБД «Омега» и принципы их взаимодействия при выполнении запросов.

Ключевые слова


параллельная СУБД; обработка сверхбольших баз данных; программное обеспечение с открытым исходным кодом; кластерные вычислительные системы

Полный текст:

PDF

Литература


Abouzeid, A. HadoopDB: An Architectural Hybrid of MapReduce and DBMS Technologies for Analytical Workloads / A. Abouzeid, K. Bajda-Pawlikowski, D. Abadi, A. Silberschatz, A. Rasin // VLDB’2009, Proceedings of 35th International Conference on

Very Large Data Bases, August 24-28, 2009, Lyon, France. – VLDB Endowment, 2009. – P. 922–933.

Boicea, A. MongoDB vs Oracle – database comparison / A. Boicea, F. Radulescu, L.I.

Agapin // Proceedings of the Third International Conference on Emerging Intelligent Data and Web Technologies, September 19-21, 2012, Bucharst, Romania. – P. 330–335.

Brown, P.G. Overview of sciDB: Large Scale Array Storage, processing and analysis / P.G. Brown // Proceedings of the ACM SIGMOD International Conference on Management of Data, June 6-10, 2010, Indianapolis, Indiana, USA. – ACM, 2010. – P. 963–968.

Hubel, M. Technical Comparison of DB2 and MySQL / M. Hubel – Martin Hubel Consulting Inc., 2004. – 32 p.

Java SE Documentation. URL: http://www.oracle.com/technetwork/java/javase/jdbc/ (дата обращения: 10.03.2013).

Kotowski, N. Parallel query processing for OLAP in grids / N. Kotowski, A.A.B. Lima, E. Pacitti, P. Valduriez, M. Mattoso // Concurrency and Computation: Practice and

Experience, – 2008. – Vol. 20, No. 17. – P. 2039–2048.

Lee, R. Extending PostgreSQL to Support Distributed/Heterogeneous Query Processing / R. Lee, M. Zhou // Proceedings of the 12th International Conference on Database Systems for Advanced Applications, April 9-12, 2007, Bangkok, Thailand. – Proceedings.

Lecture Notes in Computer Science, Springer, 2007. – Vol. 4443. – P. 1086–1097.

MySQL Cluster Information. URL: http://www.mysql.com/products/cluster/resources.html (дата обращения:

03.2013).

Oracle Store. URL: http://shop.oracle.com (дата обращения: 10.03.2013).

Paes, M. High-Performance Query Processing of a Real-World OLAP Database with ParGRES / M. Paes, A.A.B. Lima, P. Valduriez, M. Mattoso // High Performance Computing for Computational Science – VECPAR 2008: 8th International Conference,

June 24-27, 2008, Toulouse, France. – Revised Selected Papers. Springer, 2008. – P. 188–200.

Paulson, L.D. Open Source Databases Move into the Marketplace / L.D. Paulson // Computer, – 2004. – Vol. 37, No. 7. – P. 13–15.

Pavlo, A. Comparison of Approaches to Large Scale Data Analysis / A. Pavlo, A. Rasin, S. Madden, M. Stonebraker, D. DeWitt, E. Paulson, L. Shrinivas, D.J. Abadi // Proceedings of the 2009 ACM SIGMOD International Conference on Management of data,

June 29 – July 2, 2009, Providence, Rhode Island, USA. – ACM, 2009. – P. 165–178.

Press Release EMC2. URL: http://www.emc.com/about/news/press/2012/20121211-01.htm (дата обращения: 10.03.2013).

Ronstrom, M. Recovery Principles in MySQL Cluster 5.1 / M. Ronstrom, J. Oreland // Proceedings of the 31st International Conference onVery Large Data Bases, August 30 – September 2, 2005, Trondheim, Norway. – ACM, 2005. – P. 1108–1115.

Teradata Purpose-Built Platform Pricing. URL: http://www.teradata.com/t/WorkArea/DownloadAsset.aspx?id=4682 (дата обращения: 10.03.2013).

Top500 List. URL: http://www.top500.org (дата обращения: 10.03.2013).

VoltDB Documentation. URL: http://voltdb.com/community/documentation (дата обращения: 10.03.2013).

Кузнецов, С.Д. MapReduce: внутри, снаружи или сбокуот параллельных СУБД? / С.Д. Кузнецов // Труды Института системного программирования РАН. – 2010.– Т. 19. – С. 35–70.

Лепихов, А.В. Обработка запросов в СУБД для кластерных систем / А.В. Лепихов, Л.Б. Соколинский // Программирование. – 2010. – № 4. – С. 25–39.

Пан, К.С. Разработка параллельной СУБД на основе последовательной СУБД PostgreSQL с открытым исходным кодом / К.С. Пан, М.Л. Цымблер // Вестник ЮУрГУ. Серия «Математическое моделирование и программирование». – 2012. – № 18(277). – Вып. 12. – С. 112–120.




DOI: http://dx.doi.org/10.14529/cmse130306