doi: 10.17586/2226-1494-2020-20-1-118-124


УДК 004.852

ПРОГНОЗИРОВАНИЕ РЕАКЦИИ ПОЛЬЗОВАТЕЛЕЙ В СОЦИАЛЬНЫХ СЕТЯХ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ 

Попова Е.П., Леоненко В.Н.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования:
Попова Е.П., Леоненко В.Н. Прогнозирование реакции пользователей в социальных сетях методами машинного обучения // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 1. № 1. С. 118–124. doi: 10.17586/2226-1494-2020-20-1-118-124


Аннотация
Предмет исследования. Выполнен сравнительный анализ методов прогнозирования реакции пользователей на сообщение, опубликованное в социальных сетях, средствами машинного обучения. Предпочтение отдано методу, обеспечивающему наибольшую точность. Метод. Применены методы машинного обучения: метод опорных векторов, метод градиентного бустинга, случайный лес и многослойный перцептрон. В качестве референтной методики предсказания использован статистический метод регрессионного анализа — линейная регрессия. Векторизация записей для получения количественных характеристик их содержимого проведена методами
«Bag of Words», TF-IDF, Word2Vec. Качество прогноза оценивалось с помощью коэффициента детерминации R2. Основные результаты. Численный эксперимент выполнен с использованием набора данных, собранных в социальной сети «ВКонтакте». Набор содержал информацию о подписчиках сообщества, публикациях, отметках
«мне нравится», «рассказать друзьям» и комментариях к публикациям. Прогнозировалось количество отметок и число комментариев под размещенной публикацией в зависимости от ее содержания. Наиболее точные результаты получены при прогнозировании числа комментариев. Качество прогнозов количества отметок «мне нравится» и «рассказать друзьям» оказалось более низким. Практическая значимость. Результаты работы могут найти применение при анализе влияния новостей разного характера, в том числе «фейковых» новостей, на пользователей социальных сетей. Развитие методов предсказания позволит проводить планирование мер для ускорения или сдерживания распространения сообщений.
 

Ключевые слова: социальные сети, прогнозирование реакции, обработка естественного языка, машинное обучение, регрессионный анализ

Благодарности. Исследование выполнено при поддержке Российского научного фонда (соглашение № 19-11-00326).

Список литературы
1. Суходолов А.П., Бычкова А.М. «Фейковые новости» как феномен современного медиапространства: понятие, виды, назначение, меры противодействия // Вопросы теории и практики жур- налистики. 2017. Т. 6. № 2. С. 143–169. doi: 10.17150/2308-6203.2017.6(2).143-169
2. Li M., Wang X., Gao K., Zhang S. A survey on information diffusion in online social networks: Models and methods // Information (Switzerland). 2017. V. 8. N 4. P. 118. doi: 10.3390/info8040118
3. Vega-Oliveros D.A., Berton L., Vazquez F., Rodrigues F.A. The impact of social curiosity on information spreading on networks // Proc. 9th IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. 2017. P. 459–466. doi: 10.1145/3110025.3110039
4. Cyberemotions: Collective Emotions in Cyberspace / Eb. by J.A. Holyst. Berlin: Springer International Publishing, 2017. 318 p. (Understanding Complex Systems). doi: 10.1007/978-3-319-43639-5
5. Rodrigues H.S. Application of SIR epidemiological model: new trends // International Journal of Applied Mathematics and Informatics. 2016. V. 10. P. 92–97.
6. Mann R.P., Faria J., Sumpter D., Krause J. The dynamics of audience applause // Journal of the Royal Society Interface. 2013. V. 10. N 85. P. 20130466. doi: 10.1098/rsif.2013.0466
7. Kostylenko O., Rodrigues H.S. Torres D.F.M. Banking risk as an epidemiological model: an optimal control approach // Springer Proceedings in Mathematics and Statistics. 2018. V. 223. P. 165–176. doi: 10.1007/978-3-319-71583-4_12
8. Горковенко Д.К. Обзор моделей распространения информации в социальных сетях // Молодой ученый. 2017. № 8. С. 23–28.
9. Ландэ Д.В., Додонов В.А. Нелинейные свойства мультиагентной модели распространения новостей // Information Technology and Security. 2016. V. 4. N 2. P. 137–146.
10. Lande D.V., Hraivoronska A.M., Berezin B.O. Model of information spread in social networks // European Journal of Natural History. 2016. N 5. P. 41–44.
11. Шотыло Д.М., Крайнова В.Е., Скурыдин А.В. Тенденции развития искусственных нейронных сетей в цифровой экономике // ЭКОНОМИНФО. 2018. Т. 15. № 4. С. 65–69.
12. Seber G.A.F., Lee A.J. Linear Regression Analysis. 2nd ed. New Jersey: John Wiley & Sons, 2003. 582 p. (Wiley Series in Probability and Statistics).
13. Liu X., Zhu T. Deep learning for constructing microblog behavior representation to identify social media user’s personality // PeerJ Computer Science. 2016. V. 2. P. e81. doi: 10.7717/peerj-cs.81
14. Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования. М.: МЦМНО, 2013. 390 с.
15. Jamali S., Rangwala H. Digging digg: comment mining, popularity prediction, and social network analysis // Proc. of the 2009 International Conference on Web Information Systems and Mining (WISM). 2009. P. 32–38. doi: 10.1109/WISM.2009.15
16. Zhou Z.-H. Ensemble Methods: Foundations and Algorithms. Chapman&Hall/CRS, 2012. 236 p.
17. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed. NY: Springer-Verlag, 2009. 746 p. doi: 10.1007/978-0-387-84858-7
18. Sheng Y., Subhash K. A survey of prediction using social media // Department of Computer Science, Oklahoma State University. Stillwater, Oklahoma, U.S.A. [Электронный ресурс]. URL: https:// arxiv.org/abs/1203.1647, свободный, Яз.англ. (дата обращения: 19.08.2019).
19. LeCun Y., Boser B., Denker J.S., Henderson D., Howard R.E., Hubbard W., Jackel L.D. Backpropagation applied to handwritten zip code recognition // Neural Computation. 1989. V. 1. N 4. P. 541–551. doi: 10.1162/neco.1989.1.4.541
20. Cai G., Xia B. Convolutional neural networks for multimedia sentiment analysis // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2015. V. 9362. P. 159–167. doi: 10.1007/978-3- 319-25207-0_14
21. Rosenblatt F. Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Washington: Spartan Books, 1961. 616 p.
22. Kesarev S., Severiukhina O., Bochenina K. Parallel simulation of community-wide information spreading in online social networks // Communications in Computer and Information Science. 2019. V. 965. P. 136–148. doi: 10.1007/978-3-030-05807-4_12
23. Gali K., Venkatapathy S. Sentence realisation from bag of words with dependency constraints // Proc. of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics, USA. 2009. P. 19–24.
24. Shahzad Q., Ramsha A. Text mining: Use of TF-IDF to examine the relevance of words to documents // International Journal of Computer Applications. 2018. V. 181. N 1. P. 25–29. doi: 10.5120/ijca2018917395
25. Jang B., Kim I., Kim J.W. Word2vec convolutional neural networks for classification of news articles and tweets // PLoS ONE. 2019. V. 14. N 8. P. e0220976 . doi: 10.1371/journal.pone.0220976
 


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика