ФОРМАЛИЗАЦИЯ БАЗОВЫХ ПРОЦЕССОВ И МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СИСТЕМЫ МОНИТОРИНГА И АНАЛИЗА ПУБЛИКАЦИЙ ЭЛЕКТРОННЫХ СМИ

Виталий Николаевич Комаров, Сергей Михайлович Рощин

Аннотация


В статье описан подход формализации базовых процессов и построения математической модели для системы сбора и анализа данных из электронных СМИ. Авторы, в рамках проведения научного исследования, занимаются созданием системы, в том числе ведется разработка новых алгоритмов, методов и подходов сбора и анализа текстовой информации из новостных интернет-источников. Основным направлением в исследовании рассматривается применение методов интеллектуального анализа текстовых данных на основе технологии искусственных нейронных сетей, методов обработки естественного языка, text mining, машинного обучения и обработки больших данных. Цель исследования. Разработать формализованное описание модели системы мониторинга и анализа текстовой информации электронных новостных СМИ методами математического моделирования. Методы и инструментарий исследования. Предложено использование инструментария методологии математического моделирования с методами системного анализа. Для исследования системы применены такие методы системного анализа, как абстрагирование, формализация, композиция и декомпозиция, структурирование и реструктурирование, моделирование, распознавание и идентификация. Система рассматривается как формализованная модель автоматического классификатора и кластеризатора набора текстовых документов на естественном языке в виде алгебраической системы. Для решения задач классификации и кластеризации текстов предложено применять методы машинного обучения на основе нейросетевых подходов. Структура системы и составляющие её процессы, а также процессы, взаимодействующие с системой извне, представлены в виде формализованного математического описания. Результаты. Разработанное формализованное математическое описание модели системы наглядно показывает взаимосвязь компонентов системы между собой, а также внутренние процессы. Применяемый подход позволяет детализировать представление системы на основе ее декомпозиции на подсистемы и модули. Все это дает возможность упорядочить последовательности этапов создания системы и декомпозировать их на отдельные этапы работ. Заключение. Результаты, полученные в ходе проведенного исследования, позволяют перейти к следующему этапу жизненного цикла разрабатываемой информационной системы – ее программной разработке.

Ключевые слова


мониторинг информации СМИ; анализ данных; система мониторинга и анализа данных; анализ текста; математическая модель системы; интеллектуальный анализ данных; нейросетевые методы; системный анализ; классификация текстов; кластеризация текстов

Полный текст:

PDF

Литература


Комаров, В.Н. Мониторинг и системный анализ информации электронных СМИ для промышленных предприятий / В.Н. Комаров, С.М. Рощин // Наукоемкие технологии и интеллектуальные системы: сб. ст. по итогам Междунар. науч.-практ. конф. – Самара: ООО «Агентство международных исследований», 2018. – С. 36–40.

Комаров, В.Н. Разработка архитектуры системы мониторинга и анализа публикаций в сети интернет / В.Н. Комаров, С.М. Рощин // Передовые инновационные разработки. Перспективы и опыт использования, проблемы внедрения в производство: сб. науч. ст. по итогам девятой междунар. науч. конф. (31 октября 2019 г.). Ч. 2. – Казань: ООО «Конверт», 2019. –

С. 27–29.

Комаров, В.Н. Моделирование системы мониторинга и анализа информации электронных СМИ методами модельно-ориентированного системного инжиниринга / В.Н. Комаров, С.М. Рощин // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». – 2021 – Т. 21, № 1 – С. 12–22. DOI: 10.14529/ctcr210102

Зайцева, Н.А. Математическое моделирование: учеб. пособие / Н.А. Зайцева. – М.: РУТ (МИИТ), 2017. – 110 с.

Аверченков, В.И. Мониторинг и системный анализ информации в сети Интернет /

В.И. Аверченков, С.М. Рощин. – Брянск: БГТУ, 2012. – 160 с.

Анализ данных и процессов / А.А. Барсегян, М.С. Куприянов, И.И. Холод и др. – 3-е изд.,

перераб. и доп. – СПб.: БХВ-Петербург, 2009. – 512 с.

Борисов, Е.С. Классификатор текстов на естественном языке / Е.С. Борисов. – http://mechanoid.kiev.ua/neural-net-classifier-text.html (дата обращения: 5.08.2021).

Дюк, В.А. Применение технологий интеллектуального анализа данных в естественнонаучных, технических и гуманитарных областях / В.А. Дюк, А.В. Флегонтов, И.К. Фомина // Известия российского государственного педагогического университета им. А.И. Герцена. – 2011. –

№ 138. – С. 77–87.

Акимов, Д.А. Подход к классификации интернет-страниц по степени их информативности / Д.А. Акимов, О.К. Редькин, И.В. Садыков // Вестник МГТУ МИРЭА. – 2015, № 4-1 (9). –

С. 206–217.

Созыкин, А.В. Анализ текстов с помощью рекуррентных нейронных сетей / А.В. Созыкин. – https://www.youtube.com/watch?v=7Tx_cewjhGQ (дата обращения: 05.08.2021).

Архипенко, К. Рекуррентные нейронные сети в задачах анализа текстов / К. Архипенко. – https://docplayer.ru/42578505-Rekurrentnye-neyronnye-seti-v-zadachah-analiza-tekstov.html (дата обращения: 10.08.2021).

Трусов, П.В. Введение в математическое моделирование / П.В. Трусов. – М.: Университетская книга; Логос, 2007. – 440 с.

Русаков, А.М. Исследование и моделирование сложных систем / А.М. Русаков. – М.: Москов. гос. ун-т приборостроения и информатики, 2014. – 90 с.

Комаров, В.Н. Структура и обобщенный алгоритм работы системы мониторинга и анализа публикаций электронных СМИ / В.Н. Комаров, С.М. Рощин // XXI век: итоги прошлого и проблемы настоящего плюс. – 2019. – Т. 8, № 4 (48). – С. 61–66.

Комаров, В.Н. Мониторинг и системный анализ информации электронных СМИ для предприятий оборонно-промышленного комплекса России / В.Н. Комаров, С.М. Рощин // XXI век: итоги прошлого и проблемы настоящего плюс. – 2019. – Т. 8, № 2 (46). – С. 22–25.

Борисов, Е.С. Автоматизированная обработка текстов на естественном языке, с использованием инструментов языка Python / Е.С. Борисов. – http://mechanoid.kiev.ua/ml-text-proc.html (дата обращения: 10.08.2021).

Васильев, Ю. Обработка естественного языка. Python и spaCy на практике / Ю. Васильев. – СПб.: Питер, 2021. – 256 с.

Система формирования знаний в среде интернет: моногр. / В.И. Аверченков, А.В. Заболеева-Зотова, Ю.М. Казаков и др. – 3-е изд., стереотип. – М.: ФЛИНТА, 2016. – 181 с.

Вершинин, В.Е. Решение задач обработки естественного языка на основе нейросетевых моделей / В.Е. Вершинин, Е.В. Вершинин // Международная научно-практическая конференция НИЦ Аэтерна, 2018. – С. 54–59.

Витковский, А.В. Применение рекурсивных нейронных сетей для анализа тональности текста / А.В. Витковский, А.В. Жвакина // 54-я научная конференция аспирантов, магистрантов и студентов БГУИР, 2018. – С. 152–153.




DOI: http://dx.doi.org/10.14529/ctcr210403

Ссылки

  • На текущий момент ссылки отсутствуют.