ИНТЕЛЛЕКТУАЛЬНЫЙ ТРЕНД-МАЙНИНГ КАК ОДНО ИЗ СОВРЕМЕННЫХ НАПРАВЛЕНИЙ ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЙ

Светлана Олеговна Шереметьева

Аннотация


Интеллектуальный тренд-майнинг (автоматизированое выявление тенденций) из неструкту-
рированных текстовых информационных потоков, имеет важное значение для прогнозирования
и стратегического планирования. К настоящему времени исследования в области интеллектуаль-
ного тренд-майнинга в связи со сложностью глубокого автоматического анализа текстов пред-
ставляют собой набор узкоспециализированных методов и инструментов, не обеспечивая мето-
дологической базы и информационно-технологического ресурса для их экстраполяции на новые
предметные области и языки. В настоящей статье дается обзор наиболее представительных в об-
ласти исследований и делается попытка систематизировать основные направления и методы ре-
шения конкретных задач, возникающих при разработке технологий, связанных с интеллектуаль-
ной экстракцией тенденций, конечной целью которой является обработка изменений в коллекци-
ях текстов, содержательная интерпретация выявленных изменений и представление их
пользователю в «читабельной» форме. Приводятся основные этапы обработки текстов при ин-
теллектуальной экстракции тенденций, подчеркивается связь тренд-майнинга с контент-
анализом и необходимость разработки не зависящих от конкретного языка методов интеллекту-
ального тренд-майнинга, рассматривается роль специализированных онтологий как основного
ресурса для достижения этой цели. Рассматриваются наиболее релевантные методики автомати-
ческой генерации текстов, представляющих результаты тренд-майнинга.

Ключевые слова


интеллектуальный тренд-майнинг, контент-анализ, многоязычность, лингвистическая онтология, генерация отчетов

Полный текст:

PDF

Литература


Preotёiuc-Pietro, Daniel, Sina Samangooei, Trevor Cohn, Nicholas Gibbins, Mahesan Niranjan. 2012. Trendminer: An Architecture for Real Time

Analysis of Social Media Text. In Proceedings of the 6th International AAAI Conference on Weblogs and Social Media, Workshop on Real-Time Analysis and

Mining of Social Streams, ICWSM, Dublin, Ireland, 2012, pp. 38–42.

Streibel Olga. Trend Mining with Semantic-Based Learning. In European Semantic Web Conference ESWC 2008, PhD Symposium, Teneriffe, Spain,

June 2008, pp. 71–77.

Конкурентный анализ и основные тенденции российского рынка систем автоматического пожаротушения. URL: http://research-techart.ru/

report/fire-extinguishing-systems-report.htm (дата обращения: 07.02.2019). [Konkurentnyy analiz i osnovnyye tendentsii rossiyskogo rynka sistem avtomaticheskogo pozharotusheniya [Competitive analysis and

main trends of the Russian market of automatic fire

extinguishing systems]. Available at URL:http://research-techart.ru/report/fire-extinguishingsystemsreport.htm (accessed: 07.02.2019)]

Brand Analytics. URL: https://branalytics.ru/BA_description. (accessed: 07.02.2019)

Tucker, Conrad S., Harrison M. Kim. 2011. Trend Mining for Predictive Product Design. In Journal of Mechanical Design, vol. 133, iss. 11, Nov. 11, 2011.

Martínez, Paloma, Isabel Segura, Thierry Declerck, Josй L. Martínez. 2014. TrendMiner: Largescale Cross-lingual Trend Mining Summarization of Real time Media Streams. In Procesamiento del lenguaje natural, vol. 53, Sept. 2014, pp. 163–166.

Hwan Suh, Jong, Chung Hoon Park, Si Hyun Jeon. 2010. Applying text and data mining techniques to forecasting the trend of petitions filed to e-People.

In Expert Systems with Applications, vol. 37, iss. 10, October 2010, pp. 7255–7268.

Shih, Meng-Jung, Duen-Ren Liu, Ming-Li Hsu. 2010. Discovering competitive intelligence by mining changes in patent trends. In Expert Systems with Applications, vol. 37, 2010, pp. 2882–2890.

Анализ научного текста и новые мировые тенденции. URL:http://www.socialcompas.com/2018/04/05/analiz-nauchnogo-teksta-i-novyemirovyetendentsii/ [Analiz nauchnogo teksta i novyye mirovyye tendentsii [Analysis of the scientific text and new global trends]. URL: http://www. socialcompas. com/2018/04/05/analiz-nauchnogo-teksta-i-novyemirovye-

tendentsii/ (accessed: 07.02.2019)/]

TrendMiner. – URL: https://cordis.europa.eu/project/rcn/100752_en.html. (accessed: 07.02.2019)

Charu, C. Aggarwal. 2003. A framework for diagnosing changes in evolving data streams. In SIGMOD 2003: Proceedings of the 2003 ACM SIGMOD international conference on Management of data, pp. 575-586.

Piskorski, Jakub, Martin Atkinson, Silja Huttunen, Jenya Belyaeva, Roman Yangarber, Vanni Zavarella. 2010. Real-Time Text Mining in Multilingual

News for the Creation of a Pre-frontier Intelligence Picture. In ACM SIGKDD Workshop on Intelligence and Security Informatics – ISI-KDD '10,

Washington, D.C., 2010.

Кечин А.А., Кель А.Э., Кушлинский Н.Е., Филипенко М.Л. Нейроподобный текст-майнинг для выявления и характеризации самых популярных микроРНК. Нейрокомпьютеры: разработка, применение. 2016. № 9. С. 45–56. [Kechin A.A., Kel' A.E., Kushlinskiy N.Ye., Filipenko M.L. [Neurolike

text-mining to identify and characterize the most popular microrics]. Neyrokomp'yutery: razrabotka, primeneniye [Neurocomputer: working-out, use].

, no. 9. S. 45–56. (in Russ.)]

Sulova Snezhana, Latinka Todoranova, Bonimir Penchev, Radka Nacheva. 2017. Using text mining to classify research papers. In Proceedings of the

th International Multidisciplinary Scientific GeoConference SGEM. 2017, July 2017, vol. 17.

Воронов Ю.П. Чтение между строк (контент-анализ в конкурентной разведке, и не только в ней). URL: http://www.ieie.nsc.ru/eco/arhiv/ ReadStatiy/2005_11/Voronov.htm (accessed: 07.02.2019) [Voronov

Yu.P. Chteniye mezhdu strok (kontent-analiz v konkurentnoy razvedke, i ne tol'ko v ney) [Reading between the lines (content analysis in competitive intelligence, and more)] Available at: URL: http://www.ieie.nsc.ru/eco/arhiv/ReadStatiy/2005_11/Voronov.htm. (accessed: 07.02.2019)]

Шалак В. Элементы математических методов компьютерного контент-анализа текстов. ECM-Journal: журнал о системах электронного

документооборота (СЭД). URL: https://ecmjournal.ru/card.aspx?ContentID=1732717. (accessed: 07.02.2019) [Shalak V. [Elements of mathematical methods of computer content text analysis]. ECM-Journal: zhurnal o sistemakh elektronnogo dokumentooborota (SED) [Journal about Systems of Electronic DocumentManagement]. Available at: URL: https://ecmjournal.

ru/card.aspx?ContentID=1732717. (accessed: 07.02.2019) (in Russ.)]

Kort-Butler, Lisa A. Content Analysis in the Study of Crime, Media, and Popular Culture. In Oxford Research Encyclopedia of Criminology and Criminal Justice. URL: http://criminology.oxfordre.com/view/10.1093/acrefore/9780190264079.001.0001/acrefore-9780190264079-e-23 (accessed: 07.02.2019)

Majhi Sabitri, Chanda Jal, Bulu Maharana. 2016. Content analysis of Journal articles on Wiki in Science Direct Database. In Library Philosophy and Practice (e-journal), February 2016. URL: http:// digitalcommons.unl.edu/libphilprac/1331/ (accessed:07.02.2019)

Rizvi S.T., Mercier D., Agne S., Erkel S., Dengel A., & Ahmed S. Ontology-based Information Extraction from Technical Documents. In ICAART. 2018.

Konys Agnieszka. 2015. An Approach for Ontology-Based Information Extraction System Selection and Evaluation. In Przegląd Elektrotechniczny,

Nov. 2015, vol. 1, pp. 207–211.

Streibel Olga, & Malgorzata Mochol. 2010. Trend Ontology for Knowledge-Based Trend Mining in Textual Information. In 2010 Seventh International Conference on Information Technology: New Generations,

Las Vegas, NV, USA, April 2010, pp. 1285–1288.

Li Q., Shilane Ph., Fridman N. Noy, Musen M.A. Ontology Acquisition from On-line Knowledge Sources. URL: http://citeseerx.ist.psu.edu/viewdoc/ download?doi=10.1.1.18.6108&rep=rep1&type=pdf (accessed:

02.2019)

Sheremetyeva S., Zinovieva A. On Modelling Domain Ontology Knowledge for Processing Multilingual Texts of Terroristic Content. In Proceedings of the International conference digital transformation & global society (DTGS – 2018). St. Petersburg, Russia, 31 May – 1 June 2018.

Nirenburg S., & V. Raskin. 2004. Ontological Semantics, Cambridge: MIT Press, 2004, 440 p.

Niles I., & A. Pease. 2003. Linking Lexicons and Ontologies: Mapping WordNet to the Suggested Upper Merged Ontology. In Proceedings of the 2003 International conference on Information and Knowledge Engineering (IKE 03), 2003, pp. 412–416.

Arp R., B. Smith, A.D. Spear. Building Ontologies with Basic Formal Ontology. Cambridge, MA: MIT Press, 2015, 248 p.

Boguslavskii I. Semantic Analysis Based on Linguistic and Ontological Resources. In: Proceedings of the 5th International Conference on the Meaning-

Text Representations. Barcelona, 8–9 September 2011, pp. 25–36.

Mannes A.J. Golbeck. 2005. Building a Terrorism Ontology. In ISWC Workshop on Ontology Patterns for the Semantic Web, 2005, Vol. 36. URL: http://goo.gl/WXeVVv/ (accessed: 07.02.2019)

Turner M., Turner J., Weinberg D. A Simple Ontology for the Analysis of Terrorist Attacks, https://goo.gl/tqyTRG, / ( accessed: 07.02.2019).

Berners-Lee T., Hendler J., Lassila O. The Semantic Web. In Scientific American, 2001, vol. 284, iss. 5, pp. 34–43.

D’Aquin, M., Noy, N.F. 2012. Where to Publish and Find Ontologies? A Survey of Ontology Libraries. In Web Semantics: Science, Services and Agents on the World Wide Web. 2012, no. 11, pp. 96–111.

Reiter E., Dale R. Building natural language generation systems, Cambridge University Press, Cambridge, UK, 2000.

Portet F., Reiter E., Gatt A., Hunter J., Sripada S., Freer Y., Sykes CAutomatic generation of textual summaries from neonatal intensive care data, Journal of Artificial Intelligence. 2009, vol. 173, pp. 789–816.

Reiter E.. An architecture for data-to-text systems, Proceedings of European workshop on natural language generation, 2007. pp. 97–104.

Goldstein A., Shahar Y. Generation of Natural-Language Textual Summaries from Longitudinal Clinical Records, 2015. URL: https://www.

ncbi.nlm.nih.gov/pubmed/26262120 (accessed: 07.02.2019)

Greenwood M.A., Bontcheva K. Multi-Lingual Summarisation of Stream Media Software.2012. URL: (https://cordis.europa.eu/docs/projects/cnect/3/287863/080/deliverables/001-D411.pdf) (accessed:07.02.2019)


Ссылки

  • На текущий момент ссылки отсутствуют.