Оценка популярности авторов социальной сети с помощью поиска экспертов на примере сервиса Twitter

Елизавета Олеговна Цацина, Руслан Марсович Миниахметов

Аннотация


В данной работе рассмотрена смешанная языковая модель, применяемая для поиска экспертов в таких областях как анализ социальных сетей и информационный поиск, предложена адаптация этой модели для социальной сети Twitter. Рассмотрены метрики популярности в социальной сети Twitter. Предложена формула оценки популярности пользователей социальной сети Twitter с учетом оценки релевантности их сообщений заданной теме, а также описан прототип системы для сбора данных и оценки популярности по предложенной формуле.

Ключевые слова


анализ социальных сетей; информационный поиск; интеллектуальный анализ данных; поиск экспертов; анализ популярности

Полный текст:

PDF

Литература


Zhang, J. Expert Finding in A Social Network / J. Zhang, J. Tang, J. Li // Lecture Notes in Computer Science. - 2007. - Vol. 4443. - P. 1066–1069.

Bozzon, A. Choosing the Right Crowd: Expert Finding in Social Networks / A. Bozzon, M. Brambilla, S. Ceri, M. Silvestri, G. Vesci // Proceedings of the 16th International Conference on Extending Database Technology (EDBT ’13). - 2013. - P. 637–648.

Zhang, J. A Mixture Model for Expert Finding / J. Zhang, J. Tang, L. Liu, J. Li //

Proceedings of the 12th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining (PAKDD ’08). - 2008. - P. 466–478.

Manning, C. Introduction to Information Retrieval / C. Manning, P. Raghavan, H. Sch¨utze - Cambridge University Press, 2008. - 496 p.

Ponte, J. A Language Modeling Approach to Information Retrieval / J. Ponte, W. Croft // Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR ’98). - 1998. - P. 275–281.

Hiemstra, D. A Linguistically Motivated Probabilistic Model of Information Retrieval / D. Heimstra // Proceedings of the Second European Conference on Research and Advanced Technology for Digital Libraries.- 1998. - P. 569–584.

Steck, H. Item Popularity and Recommendation Accuracy / H. Steck // Proceedings of the Second European Conference on Research and Advanced Technology for Digital Libraries (RecSys ’11). - 2011. - P. 125–132.

Cha, Y. Incorporating Popularity in Topic Models for Social Network Analysis / Y. Cha, B. Bin, C. Hsieh, J. Cho // Proceedings of the 36th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR ’13). - 2013. - P. 223–232.

Документация Python библиотеки для работы с Twitter API URL: http://pythonhosted.org//tweepy/ (дата обращения: 24.04.2014).

Документация Twitter REST API URL: https://dev.twitter.com/docs/api/1.1 (дата обращения: 24.04.2014).

Stonebraker, M. The POSTGRES Next-generation Database Management System / M. Stonebraker, G. Kemnitz // Communications of the ACM. - 1991. - Vol. 34, No. 10. - P. 78–92.

Borodin, A. Online Computation and Competitive Analysis / A. Borodin, R. El-Yaniv - Cambridge University Press, 1998. - 432 p.

Янцен, Д.Д. Алгоритм репрезентативного сэмплинга для параллельных систем баз данных / Д.Д. Янцен, М.Л. Цымблер // Параллельные вычислительные технологии (ПаВТ’2014): труды международной научной конференции (1–3 апреля 2014 г., г. Ростов-на-Дону). - Челябинск: Издательский центр ЮУрГУ, 2014. - С. 381.

Пан, К.С. Подход к разбиению сверхбольших графов с помощью параллельных СУБД / К.С. Пан // Вестник ЮУрГУ. Серия “Вычислительная математика и информатика”. - 2012. - № 47(306). Вып. 2. - С. 127–132.

Рейтинг популярности пользователей в социальной сети Twitter-Twitaholic-URL: http://twitaholic.com/ (дата обращения: 24.04.2014).

Документация Python библиотеки для интеллектуального анализа данных - scikit-learn. URL: http://scikit-learn.org/stable/documentation.html (дата обращения: 24.04.2014).

Zhu, H. Finding Experts in Tag Based Knowledge Sharing Communities / H. Zhu, E. Chen, H. Cao // Proceedings of the 5th International Conference on Knowledge Science, Engineering and Management (KSEM ’11). - 2011. - P. 183–195.

Han, J. Mining Frequent Patterns without Candidate Generation: A Frequent-Pattern Tree Approach / J. Han, J. Pei, Y. Yin, R. Mao // Data Mining and Knowledge Discovery. 2005. - Vol. 8, No. 1. - P. 53–87.

Blei, D. Latent Dirichlet Allocation / D. Blei, A. Ng, Y. Yin, M. Jordan // The Journal of Machine Learning Research. - 2003. - Vol. 3. - P. 993–1022.




DOI: http://dx.doi.org/10.14529/cmse140205