Меню
Публикации
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор
НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
doi: 10.17586/2226-1494-2020-20-1-118-124
УДК 004.852
ПРОГНОЗИРОВАНИЕ РЕАКЦИИ ПОЛЬЗОВАТЕЛЕЙ В СОЦИАЛЬНЫХ СЕТЯХ МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ
Читать статью полностью
Язык статьи - русский
Ссылка для цитирования:
Аннотация
Ссылка для цитирования:
Попова Е.П., Леоненко В.Н. Прогнозирование реакции пользователей в социальных сетях методами машинного обучения // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 1. № 1. С. 118–124. doi: 10.17586/2226-1494-2020-20-1-118-124
Аннотация
Предмет исследования. Выполнен сравнительный анализ методов прогнозирования реакции пользователей на сообщение, опубликованное в социальных сетях, средствами машинного обучения. Предпочтение отдано методу, обеспечивающему наибольшую точность. Метод. Применены методы машинного обучения: метод опорных векторов, метод градиентного бустинга, случайный лес и многослойный перцептрон. В качестве референтной методики предсказания использован статистический метод регрессионного анализа — линейная регрессия. Векторизация записей для получения количественных характеристик их содержимого проведена методами
«Bag of Words», TF-IDF, Word2Vec. Качество прогноза оценивалось с помощью коэффициента детерминации R2. Основные результаты. Численный эксперимент выполнен с использованием набора данных, собранных в социальной сети «ВКонтакте». Набор содержал информацию о подписчиках сообщества, публикациях, отметках
«мне нравится», «рассказать друзьям» и комментариях к публикациям. Прогнозировалось количество отметок и число комментариев под размещенной публикацией в зависимости от ее содержания. Наиболее точные результаты получены при прогнозировании числа комментариев. Качество прогнозов количества отметок «мне нравится» и «рассказать друзьям» оказалось более низким. Практическая значимость. Результаты работы могут найти применение при анализе влияния новостей разного характера, в том числе «фейковых» новостей, на пользователей социальных сетей. Развитие методов предсказания позволит проводить планирование мер для ускорения или сдерживания распространения сообщений.
«Bag of Words», TF-IDF, Word2Vec. Качество прогноза оценивалось с помощью коэффициента детерминации R2. Основные результаты. Численный эксперимент выполнен с использованием набора данных, собранных в социальной сети «ВКонтакте». Набор содержал информацию о подписчиках сообщества, публикациях, отметках
«мне нравится», «рассказать друзьям» и комментариях к публикациям. Прогнозировалось количество отметок и число комментариев под размещенной публикацией в зависимости от ее содержания. Наиболее точные результаты получены при прогнозировании числа комментариев. Качество прогнозов количества отметок «мне нравится» и «рассказать друзьям» оказалось более низким. Практическая значимость. Результаты работы могут найти применение при анализе влияния новостей разного характера, в том числе «фейковых» новостей, на пользователей социальных сетей. Развитие методов предсказания позволит проводить планирование мер для ускорения или сдерживания распространения сообщений.
Ключевые слова: социальные сети, прогнозирование реакции, обработка естественного языка, машинное обучение, регрессионный анализ
Благодарности. Исследование выполнено при поддержке Российского научного фонда (соглашение № 19-11-00326).
Список литературы
Благодарности. Исследование выполнено при поддержке Российского научного фонда (соглашение № 19-11-00326).
Список литературы
1. Суходолов А.П., Бычкова А.М. «Фейковые новости» как феномен современного медиапространства: понятие, виды, назначение, меры противодействия // Вопросы теории и практики жур- налистики. 2017. Т. 6. № 2. С. 143–169. doi: 10.17150/2308-6203.2017.6(2).143-169
2. Li M., Wang X., Gao K., Zhang S. A survey on information diffusion in online social networks: Models and methods // Information (Switzerland). 2017. V. 8. N 4. P. 118. doi: 10.3390/info8040118
3. Vega-Oliveros D.A., Berton L., Vazquez F., Rodrigues F.A. The impact of social curiosity on information spreading on networks // Proc. 9th IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. 2017. P. 459–466. doi: 10.1145/3110025.3110039
4. Cyberemotions: Collective Emotions in Cyberspace / Eb. by J.A. Holyst. Berlin: Springer International Publishing, 2017. 318 p. (Understanding Complex Systems). doi: 10.1007/978-3-319-43639-5
5. Rodrigues H.S. Application of SIR epidemiological model: new trends // International Journal of Applied Mathematics and Informatics. 2016. V. 10. P. 92–97.
6. Mann R.P., Faria J., Sumpter D., Krause J. The dynamics of audience applause // Journal of the Royal Society Interface. 2013. V. 10. N 85. P. 20130466. doi: 10.1098/rsif.2013.0466
7. Kostylenko O., Rodrigues H.S. Torres D.F.M. Banking risk as an epidemiological model: an optimal control approach // Springer Proceedings in Mathematics and Statistics. 2018. V. 223. P. 165–176. doi: 10.1007/978-3-319-71583-4_12
8. Горковенко Д.К. Обзор моделей распространения информации в социальных сетях // Молодой ученый. 2017. № 8. С. 23–28.
9. Ландэ Д.В., Додонов В.А. Нелинейные свойства мультиагентной модели распространения новостей // Information Technology and Security. 2016. V. 4. N 2. P. 137–146.
10. Lande D.V., Hraivoronska A.M., Berezin B.O. Model of information spread in social networks // European Journal of Natural History. 2016. N 5. P. 41–44.
11. Шотыло Д.М., Крайнова В.Е., Скурыдин А.В. Тенденции развития искусственных нейронных сетей в цифровой экономике // ЭКОНОМИНФО. 2018. Т. 15. № 4. С. 65–69.
12. Seber G.A.F., Lee A.J. Linear Regression Analysis. 2nd ed. New Jersey: John Wiley & Sons, 2003. 582 p. (Wiley Series in Probability and Statistics).
13. Liu X., Zhu T. Deep learning for constructing microblog behavior representation to identify social media user’s personality // PeerJ Computer Science. 2016. V. 2. P. e81. doi: 10.7717/peerj-cs.81
14. Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования. М.: МЦМНО, 2013. 390 с.
15. Jamali S., Rangwala H. Digging digg: comment mining, popularity prediction, and social network analysis // Proc. of the 2009 International Conference on Web Information Systems and Mining (WISM). 2009. P. 32–38. doi: 10.1109/WISM.2009.15
16. Zhou Z.-H. Ensemble Methods: Foundations and Algorithms. Chapman&Hall/CRS, 2012. 236 p.
17. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed. NY: Springer-Verlag, 2009. 746 p. doi: 10.1007/978-0-387-84858-7
18. Sheng Y., Subhash K. A survey of prediction using social media // Department of Computer Science, Oklahoma State University. Stillwater, Oklahoma, U.S.A. [Электронный ресурс]. URL: https:// arxiv.org/abs/1203.1647, свободный, Яз.англ. (дата обращения: 19.08.2019).
19. LeCun Y., Boser B., Denker J.S., Henderson D., Howard R.E., Hubbard W., Jackel L.D. Backpropagation applied to handwritten zip code recognition // Neural Computation. 1989. V. 1. N 4. P. 541–551. doi: 10.1162/neco.1989.1.4.541
20. Cai G., Xia B. Convolutional neural networks for multimedia sentiment analysis // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2015. V. 9362. P. 159–167. doi: 10.1007/978-3- 319-25207-0_14
21. Rosenblatt F. Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Washington: Spartan Books, 1961. 616 p.
22. Kesarev S., Severiukhina O., Bochenina K. Parallel simulation of community-wide information spreading in online social networks // Communications in Computer and Information Science. 2019. V. 965. P. 136–148. doi: 10.1007/978-3-030-05807-4_12
23. Gali K., Venkatapathy S. Sentence realisation from bag of words with dependency constraints // Proc. of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics, USA. 2009. P. 19–24.
24. Shahzad Q., Ramsha A. Text mining: Use of TF-IDF to examine the relevance of words to documents // International Journal of Computer Applications. 2018. V. 181. N 1. P. 25–29. doi: 10.5120/ijca2018917395
25. Jang B., Kim I., Kim J.W. Word2vec convolutional neural networks for classification of news articles and tweets // PLoS ONE. 2019. V. 14. N 8. P. e0220976 . doi: 10.1371/journal.pone.0220976
2. Li M., Wang X., Gao K., Zhang S. A survey on information diffusion in online social networks: Models and methods // Information (Switzerland). 2017. V. 8. N 4. P. 118. doi: 10.3390/info8040118
3. Vega-Oliveros D.A., Berton L., Vazquez F., Rodrigues F.A. The impact of social curiosity on information spreading on networks // Proc. 9th IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. 2017. P. 459–466. doi: 10.1145/3110025.3110039
4. Cyberemotions: Collective Emotions in Cyberspace / Eb. by J.A. Holyst. Berlin: Springer International Publishing, 2017. 318 p. (Understanding Complex Systems). doi: 10.1007/978-3-319-43639-5
5. Rodrigues H.S. Application of SIR epidemiological model: new trends // International Journal of Applied Mathematics and Informatics. 2016. V. 10. P. 92–97.
6. Mann R.P., Faria J., Sumpter D., Krause J. The dynamics of audience applause // Journal of the Royal Society Interface. 2013. V. 10. N 85. P. 20130466. doi: 10.1098/rsif.2013.0466
7. Kostylenko O., Rodrigues H.S. Torres D.F.M. Banking risk as an epidemiological model: an optimal control approach // Springer Proceedings in Mathematics and Statistics. 2018. V. 223. P. 165–176. doi: 10.1007/978-3-319-71583-4_12
8. Горковенко Д.К. Обзор моделей распространения информации в социальных сетях // Молодой ученый. 2017. № 8. С. 23–28.
9. Ландэ Д.В., Додонов В.А. Нелинейные свойства мультиагентной модели распространения новостей // Information Technology and Security. 2016. V. 4. N 2. P. 137–146.
10. Lande D.V., Hraivoronska A.M., Berezin B.O. Model of information spread in social networks // European Journal of Natural History. 2016. N 5. P. 41–44.
11. Шотыло Д.М., Крайнова В.Е., Скурыдин А.В. Тенденции развития искусственных нейронных сетей в цифровой экономике // ЭКОНОМИНФО. 2018. Т. 15. № 4. С. 65–69.
12. Seber G.A.F., Lee A.J. Linear Regression Analysis. 2nd ed. New Jersey: John Wiley & Sons, 2003. 582 p. (Wiley Series in Probability and Statistics).
13. Liu X., Zhu T. Deep learning for constructing microblog behavior representation to identify social media user’s personality // PeerJ Computer Science. 2016. V. 2. P. e81. doi: 10.7717/peerj-cs.81
14. Вьюгин В.В. Математические основы теории машинного обучения и прогнозирования. М.: МЦМНО, 2013. 390 с.
15. Jamali S., Rangwala H. Digging digg: comment mining, popularity prediction, and social network analysis // Proc. of the 2009 International Conference on Web Information Systems and Mining (WISM). 2009. P. 32–38. doi: 10.1109/WISM.2009.15
16. Zhou Z.-H. Ensemble Methods: Foundations and Algorithms. Chapman&Hall/CRS, 2012. 236 p.
17. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed. NY: Springer-Verlag, 2009. 746 p. doi: 10.1007/978-0-387-84858-7
18. Sheng Y., Subhash K. A survey of prediction using social media // Department of Computer Science, Oklahoma State University. Stillwater, Oklahoma, U.S.A. [Электронный ресурс]. URL: https:// arxiv.org/abs/1203.1647, свободный, Яз.англ. (дата обращения: 19.08.2019).
19. LeCun Y., Boser B., Denker J.S., Henderson D., Howard R.E., Hubbard W., Jackel L.D. Backpropagation applied to handwritten zip code recognition // Neural Computation. 1989. V. 1. N 4. P. 541–551. doi: 10.1162/neco.1989.1.4.541
20. Cai G., Xia B. Convolutional neural networks for multimedia sentiment analysis // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2015. V. 9362. P. 159–167. doi: 10.1007/978-3- 319-25207-0_14
21. Rosenblatt F. Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Washington: Spartan Books, 1961. 616 p.
22. Kesarev S., Severiukhina O., Bochenina K. Parallel simulation of community-wide information spreading in online social networks // Communications in Computer and Information Science. 2019. V. 965. P. 136–148. doi: 10.1007/978-3-030-05807-4_12
23. Gali K., Venkatapathy S. Sentence realisation from bag of words with dependency constraints // Proc. of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics, USA. 2009. P. 19–24.
24. Shahzad Q., Ramsha A. Text mining: Use of TF-IDF to examine the relevance of words to documents // International Journal of Computer Applications. 2018. V. 181. N 1. P. 25–29. doi: 10.5120/ijca2018917395
25. Jang B., Kim I., Kim J.W. Word2vec convolutional neural networks for classification of news articles and tweets // PLoS ONE. 2019. V. 14. N 8. P. e0220976 . doi: 10.1371/journal.pone.0220976