Автоматический подбор параметров модели ARIMA для прогноза количества случаев заражения и смерти от Covid-19
Аннотация
В работе исследовано применение модели ARIMA прогнозирования временных рядов для анализа открытых данных о распространении коронавирусной инфекции в ряде регионов Российской Федерации. Рассматривается возможность применения существующих методов и алгоритмов языка программирования для статистической обработки данных R, приводятся алгоритмы подбора параметров модели ARIMA. Разработан и опубликован скрипт на языке программирования R, позволяющий осуществить с помощью стандартной библиотеки auto.arima прогнозирование суммарных случаев заражения и летальных исходов на выбранный промежуток времени. В работе показано, что параметры модели различны для временных рядов разной длины, для различных регионов, кроме того, параметры модели меняются с течением времени. Исследован имеющийся инструментарий языка R и показано, что существуют наборы данных для которых он не позволяет получить параметры модели, дающей наименьшую погрешность. Исследована частота переобучения модели, приведены данные об изменении параметров модели для временных рядов разной длины. Исследование случаев ошибки автоматического подбора параметров модели является темой для дальнейших исследований. Приведена содержательная интерпретация полученных данных. Проведено сравнение прогнозов, полученных в конце октября 2020 г. и актуальных данных на середину ноября 2020 г. Показано, что полученный прогноз позволил достаточно точно предсказать суммарное число заражений и летальных исходов на 7–10 дней.
Ключевые слова
Полный текст:
PDFЛитература
Abotaleb M.S.A., Makarovskikh T.A. Manual selection of ARIMA model parameters for predicting death cases of Covid-19 in the Chelyabinsk region. URL: https://rpubs.com/abotalebmostafa/710535 (accessed: 09.01.2021).
Abotaleb M.S.A., Makarovskikh T.A. New package "Epidemic.ta" for forecasting Covid-19 infection cases apply Example For forecasting infection cases in the USA. URL: https://rpubs.com/abotalebmostafa/711262 (accessed: 09.01.2021).
Abotaleb M.S.A., Makarovskikh T.A. Research opportunities automatic parameter selection ARIMA models for short term forecast cases Covid-19. URL: https://rpubs.com/abotalebmostafa/710470 (accessed: 09.01.2021).
Abotaleb M.S.A., Makarovskikh T.A. Using auto ARIMA for forecasting Deaths of COVID-19 in Chelyabinsk. URL: https://rpubs.com/abotalebmostafa/710528 (accessed: 09.01.2021).
Coronavirus: statistics. URL: https://yandex.ru/covid19/stat (accessed: 09.01.2021).
Lakman I.A., Agapitov A.A., Sadikova L.F. et al. Possibilities of mathematical forecasting of coronavirus infection in the Russian Federation. Arterialnaya gipertenzia. 2020. Vol. 26, no. 3. P. 288–294. (in Russian) DOI: 10.18705/1607-419X-2020-26-3-288-294.
Everitt B.S. The Cambridge Dictionary of Statistics. The Cambridge Dictionary of Statistics. Ed. 4. 2010. 736 p.
Abotaleb M.S.A. Predicting COVID-19 Cases using Some Statistical Models: An Application to the Cases Reported in China Italy and USA. Academic Journal of Applied Mathematical Sciences. 2020. Vol. 6, no. 4. P. 32–40. DOI: 10.32861/ajams.64.32.40.
Chaurasia V., Pal S. COVID-19 Pandemic: ARIMA and Regression Model-Based Worldwide Death Cases Predictions. SN Computer Science, 2020. Art. 1:288. DOI: 10.1007/s42979-020-00298-6.
COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University. URL: https://github.com/CSSEGISandData/COVID-19 (accessed: 23.11.2020).
COVID-19: Status of Cases in Toronto. URL: https://www.toronto.ca/home/covid-19/covid-19-latest-city-of-toronto-news/covid-19-status-of-cases-in-toronto/ (accessed: 23.11.2020).
Elie R., Hubert E., Turinici G. Contact rate epidemic control of COVID-19: an equilibrium view. Mathematical Modelling of Natural Phenomena. 2020. Vol. 15, art. 35. DOI: 10.1051/mmnp/2020022.
Hernandez-Matamorosb A., Fujitaa H., Hayashib T., Perez-Meana H. Forecasting of COVID-19 per regions using ARIMA models and polynomial functions. Applied Soft Computing Journal. 2020. Vol. 96, art. 106610. DOI: 10.1016/j.asoc.2020.106610.
Hussain N., Li B. Using R-studio to examine the COVID-19 Patients in Pakistan Implementation of SIR Model on Cases. International Journal of Scientific Research in Multidisciplinary Studies. 2020. Vol. 6, no. 8. P. 54–59. DOI: 10.13140/RG.2.2.32580.04482.
Hyndman R.J., Athanasopoulos G. Forecasting: principles and practice. OTexts, 2018. 384 p.
Kumar M., Gupta S., Kumar K., Sachdeva M. Spreading of Covid-19 in India, Italy, Japan, Spain, UK, US: A Prediction Using ARIMA and LSTM Model. Digital Government: Research and Practice. 2020. Vol. 1, no. 4, art. 24. DOI: 10.1145/3411760.
Panda M. Application of ARIMA and Holt-Winters forecasting model to predict the spreading of COVID-19 for India and its states. DOI: 10.1101/2020.07.14.20153908 (accessed: 10.02.2021).
Perone G. ARIMA forecasting of COVID-19 incidence in Italy, Russia, and the USA. DOI: 10.2139/ssrn.3612402.
Shokeralla A.A.A., Sameeh F.R.I., Musa A.G.M., Zahrani S. Prediction the daily number of confirmed cases of Covid-19 in Sudan with ARIMA and Holt-Winter exponential smoothing. International Journal of Development Research. 2020. Vol. 10, no. 8. P. 39408–39413 DOI: 10.37118/ijdr.19811.08.2020.
Sun D., Duan L., Xiong J., Wang D. Modelling and forecasting the spread tendency of the COVID-19 in China. BMC Infectious Diseases. DOI: 10.21203/rs.3.rs-26772/v1.
Volpert V., Banerjee M., d’Onofrio A., Lipniacki T., Petrovskii S., Tran V.Ch. Coronavirus: scientific insights and societal aspects. Mathematical Modelling of Natural Phenomena. 2020. Vol. 15, art. E2. DOI: 10.1051/mmnp/2020010.
Volpert V., Banerjee M., Petrovskii S., Volpert V. On a quarantine model of coronavirus infection and data analysis. Mathematical Modelling of Natural Phenomena. 2020. Vol. 15, art. 24. DOI: 10.1051/mmnp/2020006.
DOI: http://dx.doi.org/10.14529/cmse210202