doi: 10.17586/2226-1494-2022-22-1-82-92


УДК 004.932

Классификация объектов на изображениях с учетом искажений на основе двухэтапного топологического анализа

Еремеев С.В., Абакумов А.В.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования:
Еремеев С.В., Абакумов А.В. Классификация объектов на изображениях с учетом искажений на основе двухэтапного топологического анализа // Научно-технический вестник информационных технологий, механики и оптики. 2022. Т. 22, № 1. С. 82–92. doi: 10.17586/2226-1494-2022-22-1-82-92


Аннотация
Предмет исследования. Предложен метод автоматической классификации пространственных объектов на изображениях в условиях ограниченного набора данных. Исследована устойчивость метода к искажениям, которые часто возникают на изображениях в силу природных явлений и частичном перекрытии объектов городской инфраструктуры. Для получения высокой точности классификации с помощью существующих подходов требуется большая обучающая выборка, включая наборы данных с искажениями, что значительно увеличивает вычислительную сложность. Метод. Предложен метод двухэтапного топологического анализа изображений. Топологические признаки первоначально извлекаются при анализе изображения в диапазоне яркостей от 0 до 255, а затем от 255 до 0. Эти признаки дополняют друг друга и отражают топологическую структуру объекта. При определенных деформациях и искажениях структура объекта в виде извлеченных признаков сохраняется. Преимущество метода — небольшое количество эталонов, что снижает вычислительную нагрузку при обучении по сравнению с нейросетевым подходом. Основные результаты. Выполнено исследование и сравнение предложенного метода с современным нейросетевым подходом. Исследование проведено на наборе данных DOTA (Dataset for Object deTection in Aerial images), содержащем снимки пространственных объектов нескольких классов. При отсутствии искажений на изображении нейросетевой подход показал точность классификации свыше 98 %, а при использовании предложенного метода около 82 %. Также в работе применены искажения изображений: поворот на 90°, сужение и обрезание края на 50 %, а также их комбинации. Предложенный метод показал свою устойчивость и превзошел нейросетевой подход. В самой сложной комбинации теста снижение точности классификации нейросетевого подхода составило 46 %, в то время как для предложенного метода только 12 %. Практическая значимость. Предложенный метод целесообразно использовать при большой вероятности появления искажений на изображениях. Такие искажения возникают в сфере геоинформатики при анализе объектов разных масштабов, при различных погодных условиях, частичном перекрытии одного объекта другим, при наличии тени и других факторов. Возможно использование предложенного метода в системах технического зрения промышленных предприятий при автоматической классификации типа деталей наложенных объектов.

Ключевые слова: топологический анализ, персистентная гомология, искажение изображений, классификация объектов, нейронные сети

Благодарности. Исследование выполнено в рамках Программы развития ЯрГУ, проект № П2-К-1-Г-3/2021.

Список литературы
1. Ярошевич П.В., Богуш Р.П. Алгоритм классификации изображений парковочных мест автостоянки на основе гистограмм ориентированных градиентов и метода опорных векторов // Компьютерная оптика. 2017. Т. 41. № 1. С. 110–117. https://doi.org/10.18287/2412-6179-2017-41-1-110-117
2. Краснов Ф.В., Буторин А.В., Ситников А.Н. Обзор подходов к анализу пространственных изображений высокого разрешения для применения в геофизике // Cloud of Science. 2019. T. 6. № 1. С. 127–143.
3. Fu J., Rui Y. Advances in deep learning approaches for image tagging // APSIPA Transactions on Signal and Information Processing. 2017. V. 6. P. e11. https://doi.org/10.1017/ATSIP.2017.12
4. Ященко А.В., Беликов А.В., Петерсон М.В., Потапов А.С. Дистилляция нейросетевых моделей для детектирования и описания ключевых точек изображений // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 20. № 3. С. 402–409. https://doi.org/10.17586/2226-1494-2020-20-3-402-409
5. Blyumin S., Pogodaev A., Khabibullina E. Graph-structural modeling of some special organizational systems // Proc. of the 2nd International Conference on Control Systems, Mathematical Modeling, Automation and Energy Efficiency (SUMMA). 2020. P. 279–283. https://doi.org/10.1109/SUMMA50634.2020.9280724
6. Handrich S. Al-Hamadi A. Localizing body joints from single depth images using geodetic distances and random tree walk // Proc. 24th IEEE International Conference on Image Processing (ICIP). 2017. P. 146–150. https://doi.org/10.1109/ICIP.2017.8296260
7. Karimova L., Terekhov A., Makarenko N., Rybintsev A. Methods of computational topology and discrete Riemannian geometry for the analysis of arid territories // Cogent Engineering. 2020. V. 7. N 1. P. 1808340. https://doi.org/10.1080/23311916.2020.1808340
8. Ojala T., Pietikäinen M., Mäenpää T. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2002. V. 24. N 7. P. 971–987. https://doi.org/10.1109/TPAMI.2002.1017623
9. Мясников В.В. Реконструкция функций и цифровых изображений по их знаковым представлениям // Компьютерная оптика. 2019. Т. 43. № 6. С. 1041–1052. https://doi.org/10.18287/2412-6179-2019-43-6-1041-1052
10. Luo Z., Chen J., Takiguchi T., Ariki Y. Neutral-to-emotional voice conversion with cross-wavelet transform F0 using generative adversarial networks // APSIPA Transactions on Signal and Information Processing. 2019. V. 8. P. 1–11. https://doi.org/10.1017/ATSIP.2019.3
11. Ruckdeschel P., Kohl M. General purpose convolution algorithm in S4 classes by means of FFT // Journal of Statistical Software. 2014. V. 59. N 4. P. 1–25. https://doi.org/10.18637/jss.v059.i04
12. Касимов Д.Р. Моделирование рассуждений при поиске и описании объектов на космоснимках // Компьютерная оптика. 2020. Т. 44. № 5. С. 772–781. https://doi.org/10.18287/2412-6179-CO-716
13. Sahu S.K., Pujari A.K., Kagita V.R., Kumar V., Padmanabhan V. GP-SVM: Tree structured multiclass SVM with greedy partitioning // Proc. of the 14th International Conference on Information Technology (ICIT). 2015. P. 142–147. https://doi.org/10.1109/ICIT.2015.24
14. Zhou Q., Lan W., Zhou Y., Mo G. Effectiveness evaluation of anti-bird devices based on random forest algorithm // Proc. of the 7th International Conference on Information, Cybernetics, and Computational Social Systems (ICCSS). 2020. P. 743–748. https://doi.org/10.1109/ICCSS52145.2020.9336891
15. Xu H., Chen Y., Lin R., Kuo J. Understanding convolutional neural networks via discriminant feature analysis // APSIPA Transactions on Signal and Information Processing. 2018. V. 7. P. e20. https://doi.org/10.1017/ATSIP.2018.24
16. Рюмина Е.В., Карпов А.А. Аналитический обзор методов распознавания эмоций по выражениям лица человека // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 20. № 2. С. 163–176. https://doi.org/10.17586/2226-1494-2020-20-2-163-176
17. Edelsbrunner H., Letscher H., Zomorodian A. Topological persistence and simplification // Discrete and Computational Geometry. 2002. V. 28. N 4. P. 511–533. https://doi.org/10.1007/s00454-002-2885-2
18. Carlsson E., Carlsson G., de Silva V. An algebraic topological method for feature identification // International Journal of Computational Geometry and Applications. 2006. V. 16. N 4. P. 291–314. https://doi.org/10.1142/S021819590600204X
19. Макаренко Н.Г., Уртьев Ф.А., Князева И.С., Малкова Д.Б., Пак И.Т., Каримова Л.М. Распознавание текстур на цифровых изображениях методами вычислительной топологии // Современные проблемы дистанционного зондирования Земли из космоса. 2015. Т. 12. № 1. С. 131–144.
20. Gonzalez-Diaz R., Jimenez M.-J., Medrano B. Spatiotemporal barcodes for image sequence analysis // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2015. V. 9448. P. 61–70. https://doi.org/10.1007/978-3-319-26145-4_5
21. Еремеев С.В., Андрианов Д.Е., Титов В.С. Алгоритм совмещения пространственных объектов разномасштабных карт на основе топологического анализа данных // Компьютерная оптика. 2019. Т. 43. № 6. С. 1021–1029. https://doi.org/10.18287/2412-6179-2019-43-6-1021-1029
22. Еремеев С.В. Абакумов А.В. Программный комплекс для обнаружения и классификации природных объектов на основе топологического анализа // Программные продукты и системы. 2021. Т. 34. № 1. С. 201–208. https://doi.org/10.15827/0236-235X.133.201-208


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика