Параллельный метод объединения результатов работы программ по сборке генома

Кирилл Владимирович Романенков, Алексей Николаевич Сальников, Андрей Владимирович Алексеевский

Аннотация


В данной работе проводится исследование в области применения многопроцессорных систем для задачи коррекции сборки генома. Существует большое количество алгоритмических подходов к проблеме сборки генома из набора коротких фрагментов, при этом результаты их работы на одних и тех же экспериментальных данных зачастую существенно разнятся. Вследствие большого объема данных необходима организация вычислений в модели распре деленной памяти на вычислительном кластере. Предлагаемый подход использует комбинацию выводов программ сборки гeномов, что позволяет сделать результат более корректным в биологическом смысле.


Ключевые слова


биоинформатика; многопроцессорные системы; параллельные алгоритмы

Полный текст:

PDF

Литература


Miller J.R. Assembly algorithms for next-generation sequencing data / J.R. Miller, S. Koren,

G. Sutton // Genomics. — 2010. — Vol. 95, No. 6. — P. 315–327.

NCBI, БД Assembly, геном человека: URL: http://www.ncbi.nlm.nih.gov/assembly/883148

(дата обращения: 1.08.2015).

Информация о генах эукариотов на сайте NCBI:

URL: ftp://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS/eukaryotes.txt (дата

обращения: 1.08.2015)

Vicedomini R. GAM-NGS: genomic assemblies merger for next generation sequencing /

R. Vicedomini, F. Vezzi, S. Scalabrin, L. Arvestad, A. Policriti // BMC Bioinformatics.

Vol. 14(Suppl.7), No. 1. P. 1–18.

Yao G. Graph accordance of next-generation sequence assemblies / G. Yao, L. Ye, H. Gao,

P. Min, W.C. Warren, G.M. Weinstock // Bioinformatics. 2012. Vol. 28, No. 1.

P. 13–16.

Zimin A.V. Assembly reconciliation / V.A. Zimin, D.R. Smith, G. Sutton, J.A. Yorke //

Bioinformatics. 2008. Vol. 24, No. 1. P. 42–45.

Zorro The masked assembler URL: http://lge.ibi.unicamp.br/zorro/ (дата обращения: 22.07.2015).

European Nucleotide Archive URL: http://www.ebi.ac.uk/ena/data/view/SRR122309

(дата обращения: 1.08.2015).

Encephalitozoon cuniculi GB-M1

URL: http://www.ncbi.nlm.nih.gov/genome/39?genome_assembly_id=22671 (дата об-

ращения: 1.08.2015).

Gurevich A. QUAST: quality assessment tool for genome assemblies / A. Gurevich,

V. Saveliev, N. Vyahhi, G. Tesler // Bioinformatics. 2013. Vol. 29, No. 8. P. 1072–1075.

Koren S. Automated ensemble assembly and validation of microbial genomes / S. Koren,

T.J. Treangen, C.M. Hill, M. Pop, A.M. Phillippy // BMC Bioinformatics. 2014. Vol. 15,

N. 5. P. 126–134.

Simpson J.T. Efficient construction of an assembly string graph using the FM-index /

J.T. Simpson, R. Durbin // Bioinformatics. 2010. Vol. 26, N. 12. P. 367–373.




DOI: http://dx.doi.org/10.14529/cmse160103