Свойства вычислительных процессов в задачах анализа изображений и машинного обучения

Ирина Васильевна Парасич, Андрей Викторович Парасич

Аннотация


Процесс решения любой задачи компьютерного зрения или машинного обучения можно представить в виде некоторой последовательности вычислительных операций над набором входных данных. Особенностью задач интеллектуального анализа данных является существенная неоднородность входных данных – могут присутствовать выбросы, неточность измерений, мультимодальность. Разные типы вычислительных операций по-разному реагируют на представленные типы рассогласований. При этом от свойств базовых операций и их устойчивости к рассогласованиям в данных во многом зависит качество решения задачи. В статье рассматриваются основные типы вычислительных операций, применяемых в алгоритмах компьютерного зрения и машинного обучения, проводится анализ их устойчивости к различным типам рассогласований в данных. Рассмотренная информация будет полезна при проектировании дескрипторов визуальных объектов, алгоритмов распознавания и трекинга объектов. Особую ценность представляет применение рассмотренной информации к проектированию и анализу глубоких сверточных нейронных сетей.


Ключевые слова


компьютерное зрение; машинное обучение; сверточные нейронные сети; трекинг; фильтрация

Полный текст:

PDF (English)

Литература


Leibe, B. An implicit shape model for combined object categorization and segmentation / B. Leibe, A. Leonardis, B. Schiele. – Springer Berlin Heidelberg, 2006. – P. 508–524.

Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. – М.: Техносфера, 2005. – 1072 с.

Nagi, J. Max-pooling convolutional neural networks for vision-based hand gesture recognition / J. Nagi, F. Ducatelle, G.A. DiCaro et al. // IEEE International Conference on Signal and Image Processing Applications (ICSIPA) – IEEE, 2011. – P. 342–347.

Magee, J.F. Decision trees for decision making / J.F. Magee // Harvard Business Review. – 1964. – Vol. 42, no. 4. – pp. 126–138.

Krizhevsky, A. Imagenet classification with deep convolutional neural networks / A. Krizhevsky, I. Sutskever, G.E. Hinton // NIPS 2012: Neural Information Processing Systems. – Lake Tahoe, Nevada, 2012. – P. 1097–1105.

Simonyan, K. Very deep convolutional networks for large-scale image recognition / K. Simonyan, A. Zisserman // arXiv technical report:1409.1556. – 2014.

Karnowski, E. Alexnet visualization / E. Karnowski. – July 15, 2015. – https://jeremykarnowski.wordpress.com/2015/07/15/alexnet-visualization/

Azimi, M. Skeletal joint smoothing white paper / M. Azimi. – https://msdn.microsoft.com/en-us/library/jj131429.aspx

Fischler, M.A. Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography / M.A. Fischler, R.C. Bolles // Communications of the ACM. – 1981. – Vol. 24, no. 6. – P. 381–395.




DOI: http://dx.doi.org/10.14529/ctcr170114

Ссылки

  • На текущий момент ссылки отсутствуют.