ОЦЕНИВАНИЕ НЕОПРЕДЕЛЁННОСТИ В МАШИННОМ ОБУЧЕНИИ

Валентин Юльевич Арьков, Алия Маратовна Шарипова, Григорий Геннадьевич Куликов

Аннотация


Большинство методов машинного обучения основаны на статистической теории обучения, при этом часто используется упрощение процедур для достижения приемлемой скорости вычислений. Цель исследования. Сформировать общий подход к оценке неопределенности в моделях машинного обучения. В эконометрике в любой модели в обязательном порядке ставится неопределенность в форме стандартного отклонения («сигмы») для коэффициентов и для прогнозов. Проблема заключается в том, что в машинном обучении нельзя аналитически посчитать неопределенность через «сигму». Поэтому вместо аналитических методов мы предлагаем использовать численные методы. Материалы и методы. Для детального рассмотрения вопроса оценивания неопределённости выбраны классические методы регрессионного анализа, в которых уделяется большое внимание неопределённости коэффициентов модели и – что более важно – точности прогнозов, полученных по такой модели. Результаты. Предлагается технология оценки неопределённости, демонстрируемая на модельном примере для того, чтобы показать, что она согласуется с традиционными классическими методами по результатам. В дальнейшей практике мы предлагаем использовать кросс-валидацию. Заключение. При использовании машинных моделей сложных процессов, в том числе прогнозов, построенных по таким моделям, при принятии управленческих решений становится всё более актуальной проблема оценивания неопределённости и вытекающих из этой неизбежной неопределённости рисков. Данная проблема может быть решена на основе непараметрических методов, хотя для этого потребуется гораздо большая вычислительная мощность, чем та, которая используется для обучения машинной модели. Предлагаемый подход можно обобщить и для других методов машинного обучения, например, для задачи классификации и кластеризации.

Ключевые слова


неопределённость параметров, обучение с учителем, моделирование, методы прогнозирования

Полный текст:

PDF


DOI: http://dx.doi.org/10.14529/ctcr230305

Ссылки

  • На текущий момент ссылки отсутствуют.