ИСПОЛЬЗОВАНИЕ ТЕОРИИ МНОЖЕСТВ В СРАВНИТЕЛЬНО-ЛОГИЧЕСКИХ МЕТОДАХ ВЫДЕЛЕНИЯ ТЕКСТОВ НА ИСЛАМСКУЮ ТЕМАТИКУ В ПРОЦЕССЕ МОНИТОРИНГА СЕТЕВЫХ РЕСУРСОВ

Булат Гилимдарович Фаткулин

Аннотация


Выделение текстов исламского содержания в сетевых ресурсах может проводиться с помо-
щью сравнительно-логических методов «проверка на вхождение» и «пересечение множеств».
Для какого-либо языка предварительно собирается корпус прецедентных текстов на исламскую
тематику. Из этого корпуса при помощи статистических методов извлекается множество ключе-
вых понятий. Список выделенных ключевых слов представляется в виде множества. Сформиро-
ванное множество ключевых понятий может быть представлено в виде базы данных и в даль-
нейшем используется в качестве эталонного множества А. Тексты, представляющие интерес для
экспертизы, представляются в виде множества понятий Б. Множество А сравнивается с множе-
ством А на предмет пересечения. Наличие в множестве Б элементов множества А, характер и
степень пересечения двух множеств позволяет идентифицировать текст, представляющий инте-
рес для экспертизы. Язык программирования Python предоставляет широкие возможности для
работы со строками, кортежами, словарями и множествами. В процессе мониторинга сетевых ре-
сурсов и поиска текстов на исламскую тематику необходимо использовать методы, изложенные
в статье, а также базы данных с эталонными списками ключевых слов.

Ключевые слова


информационный экстремизм, судебная лингвистическая экспертиза, сете- вые ресурсы, мониторинг сетевых ресурсов, сравнительно-статистические методы, язык Python, множества, лингвистические ресурсы, прецедентные тексты, ислам

Полный текст:

PDF

Литература


Жукова, О.С. Информационный экстре-

мизм как угроза безопасности Российской Федера-

ции / О.С. Жукова // Вестник Воронежского ин-

ститута МВД России. – 2007. – Т. 1.

Кокорев, В.Г. Понятие и признаки религи-

озного экстремизма / В.Г. Кокорев // Социально-

экономические явления и процессы. – 2014. – Т. 5.

Шибаев, М.В. Манипулятивное использо-

вание прецедентных текстов в религиозном дис-

курсе / М.В. Шибаев // Вестник Красноярского

государственного педагогического университета

им. В.П. Астафьева. – 2013. – Т. 3.

Прохоренок, Н. Python 3. Самое необходи-

мое / Н. Прохоренок. – БХВ-Петербург, 2016.

Караулов, Ю.Н. Русский язык и языковая

личность / Ю.Н. Караулов, Д.Н. Шмелев. – М.:

Наука, 1987.

Бобырева, Е.В. Прецедентные высказыва-

ния религиозного дискурса / Е.В. Бобырева // Из-

вестия Волгоградского государственного педаго-

гического университета. – 2007. – Т. 2.

Chiarcos, C. Towards Open Data for Linguistics:

Linguistic Linked Data / C. Chiarcos // New

Trends of Research in Ontologies and Lexical Resources.

– 2013. – P. 7–25.

Мишанкина, Н.А. Базы данных в лингвис-

тических исследованиях / Н.А. Мишанкина // Во-

просы лексикографии. – 2013. – Т. 1 (3).

Мишанкина, Н.А. Технология баз данных в

социогуманитарных исследованиях / Н.А. Мишан-

кина // Гуманитарная информатика. – 2012. – Т. 6.

Мишланов, В.А. Диалогичность церковно-

религиозных текстов / В.А. Мишланов, В.А. Сали-

мовский // Вестн. Перм. ун-та. – 2010. – Т. 6, № 12.

– С. 24–28.

Мишланов, В.А. Этнический экстремизм в

массовой коммуникации с точки зрения проблем

судебной лингвистической экспертизы / В.А. Миш-

ланов, В.А. Салимовский // Вестн. Перм. ун-та. –

– Т. 4, № 24. – С. 63–75.

Saad, M. OSAC: Open Source Arabic Corpora

/ M. Saad, W. Ashour // 6th International Conference

on Electrical and Computer Systems

(EECS’10), Nov 25-26, 2010, Lefke, Cyprus. 2010. –

P. 118–123.

Фаткулин, Б.Г. Использование лингвисти-

чески ориентированных модулей на языке python

для обработки больших текстовых массивов на

восточных языках в целях эффективного сбора и

обработки данных по отраслям востоковедческой

тематики (на примере NLTK) / Б.Г. Фаткулин //

Вестник ЮУрГУ. Серия «Лингвистика». – 2015. –

Т. 12, № 1. – С. 72–75.




DOI: http://dx.doi.org/10.14529/ling160304

Ссылки

  • На текущий момент ссылки отсутствуют.