doi: 10.17586/2226-1494-2023-23-2-279-288


УДК 004.8 004.056.53

Предсказание результатов 16-факторного теста Р. Кеттелла на основе анализа текстовых постов пользователей социальной сети

Олисеенко О.Д., Абрамов М.В.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования:
Олисеенко В.Д., Абрамов М.В. Предсказание результатов 16-факторного теста Р. Кеттелла на основе анализа текстовых постов пользователей социальной сети // Научно-технический вестник информационных технологий, механики и оптики. 2023. Т. 23, № 2. С. 279–288. doi: 10.17586/2226-1494-2023-23-2-279-288


Аннотация
Предмет исследования. Исследована возможность автоматизации предсказания по небольшому набору данных оценки выраженности психологических особенностей по 16-факторному личностному тесту Р. Кеттелла пользователей социальной сети на основе анализа публикуемых ими на своей странице текстовых постов. Метод. Предложенный новый метод автоматизации оценки выраженности психологических особенностей по 16-факторному личностному тесту Р. Кеттелла включает в себя языковые модели и нейронные сети. Реализация метода предусматривает несколько шагов. На первом шаге происходит извлечение из аккаунтов пользователей социальной сети текстовых постов, их предобработка с помощью языковой модели RuBERT и ранее обученной достроенной над ней полносвязной нейронной сети. Итогом этого шага является нормализованное эмпирическое распределение постов по ранее введенным классам по каждому пользователю. Впоследствии на основе распределения постов пользователей производится оценка выраженности психологических особенностей пользователя с использованием метода опорных векторов, случайного леса и наивного байесовского классификатора. Основные результаты. Финальный набор данных для построения моделей и дальнейшего тестирования их работы составлен из 183 респондентов, прошедших тест Р. Кеттелла, со ссылками на их открытые аккаунты в социальной сети. Построены классификаторы, предсказывающие результаты для шести факторов (A, B, F, I, N, Q1) 16-факторного личностного теста Р. Кеттелла. Практическая значимость. Полученные результаты могут найти применение при создании прототипа автоматизированной системы предсказания оценки выраженности психологических особенностей пользователей социальной сети. Результаты работы полезны в прикладных и исследовательских системах, связанных с маркетингом, психологией и социологией, а также в области защиты пользователей от социоинженерных атак.

Ключевые слова: социальные сети, классификация текстов, искусственный интеллект, 16-факторный тест Р. Кеттелла, машинное обучение, нейронные сети

Благодарности. Работа выполнена в рамках проекта по государственному заданию СПБ ФИЦ РАН № FFZF-2022-0003; при финансовой поддержке РФФИ, проект № 20-07-00839; при финансовой поддержке гранта Президента Российской Федерации МK5237.2022.1.6.

Список литературы
  1. Vander Shee B.A., Peltier J., Dahl A.J. Antecedent consumer factors, consequential branding outcomes and measures of online consumer engagement: Current research and future directions // Journal of Research in Interactive Marketing. 2020. V. 14. N 2. P. 239–268. https://doi.org/10.1108/JRIM-01-2020-0010
  2. Fayaz A., Muhammad Z.T., Ayaz A. The Big Five dyad congruence and compulsive buying: A case of service encounters // Journal of Retailing and Consumer Services. 2022. V. 68. P. 103007. https://doi.org/10.1016/j.jretconser.2022.103007
  3. Shanahan T., Tran T.P., Taylor E.C. Getting to know you: Social media personalization as a means of enhancing brand loyalty and perceived quality // Journal of Retailing and Consumer Services. 2019. N 47. P. 57–65. https://doi.org/10.1016/j.jretconser.2018.10.007
  4. Woods S.A., Mustafa M.J., Anderson N., Sayer B. Innovative work behavior and personality traits: Examining the moderating effects of organizational tenure // Journal of Managerial Psychology. 2018. V. 33. N 1. P. 29–42. https://doi.org/10.1108/JMP-01-2017-0016
  5. Bouiri O., Lotfi S., Talbi M. Correlative study between personality traits, student mental skills and educational outcomes // Education Sciences. 2021. V. 11. N 4. P. 153. https://doi.org/10.3390/educsci11040153
  6. Chekalev A.A., Khlobystova A.O., Tulupyeva T.V. Applicant's decision support system for choosing the direction of study // Proc. of the XXV International Conference on Soft Computing and Measurements (SCM). 2022. P. 226–228. https://doi.org/10.1109/SCM55405.2022.9794902
  7. Stoliarova V.F., Tulupyev A.L. Cumulative mean function of public posting episodes in the online media with regard to user’s digital traces: Limited data on publications dates and profile data // Proc. of the XXV International Conference on Soft Computing and Measurements (SCM). 2022. P. 25–27. https://doi.org/10.1109/SCM55405.2022.9794894
  8. Thielmann I., Spadaro G., Balliet D. Personality and prosocial behavior: A theoretical framework and meta-analysis // Psychological Bulletin. 2020. V. 146. N 1. P. 30–90. https://doi.org/10.1037/bul0000217
  9. Clark C., Davila A., Regis M., Kraus S. Predictors of COVID-19 voluntary compliance behaviors: An international investigation // Global Transitions. 2020. V. 2. P. 76–82. https://doi.org/10.1016/j.glt.2020.06.003
  10. Khlobystova A.O., Abramov M.V., Tulupyev A.L. Soft estimates for social engineering attack propagation probabilities depending on interaction rates among instagram users // Studies in Computational Intelligence. 2020. V. 868. P. 272–277. https://doi.org/10.1007/978-3-030-32258-8_32
  11. Piotrowski C., Sherry D., Keller J.W. Psychodiagnostic test usage: A survey of the society for personality assessment // Journal of Personality Assessment. 1985.V. 49. N 2. P. 115–119. https://doi.org/10.1207/s15327752jpa4902_1
  12. Goldber L.R. An alternative "description of personality": the big-five factor structure // Journal of Personality and Social Psychology. 1990. V. 59. N 6. P. 1216–1229. https://doi.org/10.1037/0022-3514.59.6.1216
  13. Schwartz S.H. A proposal for measuring value orientations across nations // Questionnaire Development Package of the European Social Survey. 2003. N 259(290). P. 261–319.
  14. Cattell H.E.P., Mead A.D. The sixteen personality factor questionnaire (16PF) // The SAGE Handbook of Personality Theory and Assessment. V. 2. 2008. P. 135–159.https://doi.org/10.4135/9781849200479.n7
  15. Plutchik R., Kellerman H., Conte H.R. A structural theory of ego defenses and emotions // Emotions, Personality, and Psychotherapy. Boston: Springer, 1979. P. 227–257. https://doi.org/10.1007/978-1-4613-2892-6_9
  16. Тулупьева Т.В., Тафинцева А.С., Тулупьев А.Л. Подход к анализу отражения особенностей личности в цифровых следах//Вестник психотерапии. 2016. № 60(65). С. 124–137.
  17. Azucar D., Marengo D., Settanni M. Predicting the Big 5 personality traits from digital footprints on social media: A meta-analysis // Personality and Individual Differences. 2018. V. 124. P. 150–159. https://doi.org/10.1016/j.paid.2017.12.018
  18. Oliseenko V.D., Tulupyeva T.V. Neural network approach in the task of multi-label classification of user posts in online social networks // Proc. of the XXIV International Conference on Soft Computing and Measurements (SCM). 2021. P. 46–48. https://doi.org/10.1109/SCM52931.2021.9507148
  19. Oliseenko V.D., Eirich M., Tulupyev A.L., Tulupyeva T.V. BERT and ELMo in task of classifying social media users posts // Lecture Notes in Networks and Systems. 2023. V. 566. P. 475–486. https://doi.org/10.1007/978-3-031-19620-1_45
  20. Tay L., Woo S.E., Hickman L., Saef R.M. Psychometric and validity issues in machine learning approaches to personality assessment: A focus on social media text mining // European Journal of Personality. 2020. V. 34. N 5. P. 826–844. https://doi.org/10.1002/per.2290
  21. Bleidorn W., Hopwood Ch.J. Using machine learning to advance personality assessment and theory // Personality and Social Psychology Review. 2019. V. 23. N 2. P. 190–203.https://doi.org/10.1177/1088868318772990
  22. Kahn J.H., Tobin R.M., Massey A.E., Anderson J.A. Measuring emotional expression with the Linguistic Inquiry and Word Count // The American Journal of Psychology. 2007.V. 120. N 2. P. 263–286. https://doi.org/10.2307/20445398
  23. Hartmann J., Huppertz J., Schamp C., Heitmann M. Comparing automated text classification methods // International Journal of Research in Marketing. 2019. V. 36. N 1. P. 20–38. https://doi.org/10.1016/j.ijresmar.2018.09.009
  24. Eichstaedt J.C., Kern M.L., Yaden D.B., Schwartz H.A., Giorgi S., Park G., Hagan C.A., Tobolsky V.A., Smith L.K., Buffone A., Iwry J., Seligman M.E.P., Ungar L.H. Closed- and open-vocabulary approaches to text analysis: A review, quantitative comparison, and recommendations // Psychological Methods. 2021. V. 26. N 4. P. 398–427. https://doi.org/10.1037/met0000349
  25. Devlin J., Chang M.-W., Lee K., Toutanova K. BERT: Pre-training of deep bidirectional transformers for language understanding // Proc. of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL). V. 1. 2019. P. 4171–4186. https://doi.org/10.18653/v1/N19-1423
  26. Peters M.E., Neumann M., Iyyer M., Gardner M., Clark C., Lee K., Zettlemoyer L. Deep contextualized word representations // Proc. of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL). V. 1. 2018. P. 2227–2237. https://doi.org/10.18653/v1/N18-1202
  27. Brown T.B., Mann B., Ryder N., Subbiah M., Kaplan J.D., Dhariwal P., Neelakantan A., Shyam P., Sastry G., Askell A., Agarwal S., Herbert-Voss A., Krueger G., Henighan T., Child R., Ramesh A., Ziegler D., Wu J., Winter C., Hesse C., Chen M., Sigler E., Litwin M., Gray S., Chess B., Clark J., Berner Ch., McCandlish S., Radford A., Sutskever I., Amodei D. Language models are few-shot learners // Advances in Neural Information Processing Systems 33 (NeurIPS 2020). 2020.
  28. Sun J., Tian Z., Fu Y., Geng J., Liu C. Digital twins in human understanding: a deep learning-based method to recognize personality traits // International Journal of Computer Integrated Manufacturing. 2021. V. 34. N 7-8. P. 860–873. https://doi.org/10.1080/0951192X.2020.1757155
  29. Wang Z., Wu C.-H., Li Q.-B., Yan B., Zheng K.-F. Encoding text information with graph convolutional networks for personality recognition // Applied Science. 2020. V. 10. N 12. P. 4081. https://doi.org/10.3390/app10124081
  30. Cortes C., Vapnik V. Support-vector networks // Machine Learning. 1995. V. 20. N 3. P. 273–297. 
  31. Breiman L. Random forests // Machine Learning. 2001. V. 45. N 1. P. 5–32. https://doi.org/10.1023/A:1010933404324
  32. Friedman N., Geiger D., Goldszmidt M. Bayesian network classifiers // Machine Learning. 1997. V. 29. N 2-3. P. 131–163. https://doi.org/10.1023/a:1007465528199
  33. Grandini M., Bagli E., Visani G. Metrics for multi-class classification: an overview. 2020 [Электронныйресурс]. URL: https://arxiv.org/abs/2008.05756(датаобращения: 01.09.2022).
  34. Refaeilzadeh P., Tang L., Liu H. Cross-Validation // Encyclopedia of Database Systems. Boston: Springer, 2009. P. 532–538. https://doi.org/10.1007/978-0-387-39940-9_565
  35. Груздева А.С., Бессмертный И.А. Классификация коротких текстов с использованием волновой модели // Научно-технический вестник информационных технологий, механики и оптики. 2022. Т. 22. № 2. С. 287–293. https://doi.org/10.17586/2226-1494-2022-22-2-287-293


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика