Меню
Публикации
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор
![](/pic/nikiforov.jpg)
НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
doi: 10.17586/2226-1494-2023-23-6-1143-1151
УДК 519.86
Эмоциональный анализ данных социальных сетей с использованием кластерной вероятностной нейронной сети с параллелизмом данных
Читать статью полностью
![](/images/pdf.png)
Язык статьи - английский
Ссылка для цитирования:
Аннотация
Ссылка для цитирования:
Старлин Джини С., Ченталир Индра Н. Эмоциональный анализ данных социальных сетей с использованием кластерной вероятностной нейронной сети с параллелизмом данных // Научно-технический вестник информационных технологий, механики и оптики. 2023. Т. 23, № 6. С. 1143–1151 (на англ. яз.). doi: 10.17586/2226-1494-2023-23-6-1143-1151
Аннотация
Социальные сети содержат огромное количество данных, которые используются различными организациями для изучения эмоций, мыслей и мнений людей. Пользователи часто используют смайлы и эмодзи в дополнение к словам, чтобы выразить свое мнение по обсуждаемой теме. Идентификация эмоций в тексте также требует изучения, однако исследования в этой области все еще находятся в начальном состоянии. Сегодня доступно недостаточно наборов данных с аннотациями интенсивностей эмоций. Сложность задачи аннотирования эмоций и дальнейшие комментарии пользователей становятся проблемами при разработке новых наборов данных. Для решения этих проблем выполняются многочисленные исследования. Разработанные методы не смогли осуществить классификацию эмоций простым и экономичным способом. В настоящей работе представлена модель эффективной классификации эмоций в записях на основе кластеризации. Набор данных записей в социальных сетях предварительно обработан для удаления нежелательных элементов и далее кластеризован. С целью повышения эффективности классификации выбраны семантические и эмоциональные признаки. Для сокращения времени вычислений и повышения эффективности системы прогнозирования вероятности эмоций предложена концепция параллелизма данных в классификаторе. Предложенная модель апробирована с использованием программного обеспечения MATLAB. В результате модель обеспечила точности для аннотированного набора данных — 92 %, а для WASSA-2017 – 94 %. Выполнен анализ производительности описанной модели с существующими методами, такими как Parallel K-Nearest Neighboring и Parallel Naive Byes Model. Результаты сравнения показали, что предложенная модель наиболее эффективно предсказывает эмоции по сравнению с существующими.
Ключевые слова: эмоции, кластеризация, извлечение признаков, вероятностная нейронная сеть и параллелизм данных
Список литературы
Список литературы
- Lee N., Ajanthan T., Torr P.H., Jaggi M. Understanding the effects of data parallelism and sparsity on neural network training// arXiv. 2021.arXiv:2003.11316. https://doi.org/10.48550/arXiv.2003.11316
- Xun Y., Zhang J., Qin X., Zhao X. FiDoop-DP: Data partitioning in frequent itemset mining on hadoop clusters // IEEE Transactions on Parallel and Distributed Systems. 2017. V. 28. N 1. P. 101–114. https://doi.org/10.1109/tpds.2016.2560176
- Kulkarni M., Pingali K., Ramanarayanan G., Walter B., Bala K., Chew L.P. Optimistic parallelism benefits from data partitioning // ACM SIGPLAN Notices. 2008. V. 43. N 3. P. 233–243. https://doi.org/10.1145/1353536.1346311
- Hernández Á.B., Perez M.S., Gupta S., Muntés-Mulero V. Using machine learning to optimize parallelism in big data applications // Future Generation Computer Systems. 2018. V. 86. P. 1076–1092. https://doi.org/10.1016/j.future.2017.07.003
- Karthick S. Semi supervised hierarchy forest clustering and KNN based metric learning technique for machine learning system// Journal of Advanced Research in Dynamical and Control Systems.2017. V. 9. P. 2679–2690.
- Chatterjee A., Gupta U., Chinnakotla M.K., Srikanth R., Galley M., Agrawal P. Understanding emotions in text using deep learning and big data // Computers in Human Behavior. 2019. V. 93. P. 309–317. https://doi.org/10.1016/j.chb.2018.12.029
- Marimuthu M., Rajalakshmi M.,Phil M.C.A.M. A big data clustering algorithm for sentiment analysis to search the crucial statistics for decision making // International Journal for Research and Development in Technology (IJRDT). 2017. V. 7. N 2. P. 132–138.
- Feng N., Xu S., Liang Y., Liu K. A probabilistic process neural network and its application in ECG classification // IEEE Access. 2019. V. 7. P. 50431–50439. https://doi.org/10.1109/access.2019.2910880
- He Q., Zhuang F., Li J., Shi Z. Parallel implementation of classification algorithms based on MapReduce // Lecture Notes in Computer Science. 2010. V. 6401. P. 655–662. https://doi.org/10.1007/978-3-642-16248-0_89
- Tang D., Wei F., Yang N., Zhou M., Liu T., Qin B. Learning sentiment-specific word embedding for twitter sentiment classification // Proc. of the 52nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2014. P. 1555–1565. https://doi.org/10.3115/v1/p14-1146
- Mahmoodabadi M.J. Epidemic model analyzed via particle swarm optimization based homotopy perturbation method // Informatics in Medicine Unlocked. 2020. V. 18. P. 100293. https://doi.org/10.1016/j.imu.2020.100293
- Gupta V., Choudhary D., Tang P.T.P., Wei X., Wang X., Huang Y., Kejariwal A., Ramchandran K., Mahoney M.W. Training recommender systems at scale: Communication-efficient model and data parallelism // arXiv.2020.arXiv:2010.08899. https://doi.org/10.48550/arXiv.2010.08899
- Ye X., Zhao J., Chen Y., Guo L.J. Bayesian adversarial spectral clustering with unknown cluster number // IEEE Transactions on Image Processing. 2020. V. 29. P. 8506–8518. https://doi.org/10.1109/tip.2020.3016491
- Schneider S., Hirzel M., Gedik B., Wu K.L. Safe data parallelism for general streaming // IEEE Transactions on Computers. 2015. V. 64. N 2. P. 504–517. https://doi.org/10.1109/tc.2013.221
- Alguliyev R.M., Aliguliyev R.M., Sukhostat L.V. Efficient algorithm for big data clustering on single machine // CAAI Transactions on Intelligence Technology. 2020. V. 5. N 1. P. 9–14. https://doi.org/10.1049/trit.2019.0048
- Kinra A., Beheshti-Kashi S., Buch R., Nielsen T.A.S., Pereira F. Examining the potential of textual big data analytics for public policy decision-making: A case study with driverless cars in Denmark // Transport Policy. 2020. V. 98. P. 68–78. https://doi.org/10.1016/j.tranpol.2020.05.026
- Bolla S., Anandan R. Privacy preservation of data using efficient group cost optimization method with big data clustering // International Journal of Advanced Research in Engineering and Technology (IJARET). 2020. V. 11. N 11. P. 748–760. https://doi.org/10.34218/IJARET.11.11.2020.071
- Fan W., Bouguila N. Spherical data clustering and feature selection through nonparametric Bayesian mixture models with von Mises distributions // Engineering Applications of Artificial Intelligence. 2020. V. 94. P. 103781. https://doi.org/10.1016/j.engappai.2020.103781
- Alotaibi N., Al-onazi B.B., Nour M.K., Mohamed A., Motwakel A., Mohammed G.P., Yaseen I., Rizwanullah M. Political optimizer with probabilistic neural network-based Arabic comparative opinion mining // Intelligent Automation & Soft Computing. 2023. V. 36. N 3. P. 3121–3137. https://doi.org/10.32604/iasc.2023.033915