Меню
Публикации
2026
2025
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор
НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
doi: 10.17586/2226-1494-2026-26-2-420-427
УДК 004.896
Применение гибридных методов искусственного интеллекта для практических производственных задач в условиях труднодоступности обучающих данных
Читать статью полностью
Язык статьи - русский
Ссылка для цитирования:
Аннотация
Ссылка для цитирования:
Соловьев Г.В., Соколов М.С. Применение гибридных методов искусственного интеллекта для практических производственных задач в условиях труднодоступности обучающих данных // Научно-технический вестник информационных технологий, механики и оптики. 2026. Т. 26, № 2. С. 420–427. doi: 10.17586/2226-1494-2026-26-2-420-427
Аннотация
Введение. Современные производственные задачи, такие как контроль качества лазерной сварки и локализация геометрических признаков в промышленных процессах, требуют применения инновационных подходов машинного обучения. Недостаток размеченных данных и сложность геометрической аннотации являются критическими барьерами при разработке автоматизированных систем контроля. Научная новизна предлагаемого подхода заключается в комплексном использовании гибридных методов, объединяющих эволюционную оптимизацию, диффузионные модели и сверточные нейронные сети для эффективного решения практических инженерных задач с ограниченными ресурсами данных. Метод. Предложенный подход состоит из двух интегрированных компонентов. Первый компонент реализует гибридный алгоритм генерации синтетических данных, объединяющий эволюционную оптимизацию для генерации разнообразных геометрических вариантов с использованием диффузионных моделей для синтеза фотореалистичных изображений. Второй компонент включает специализированную архитектуру глубокого обучения, оптимизированную для точной локализации и классификации геометрических признаков в производственных контекстах. Обучение реализуется с применением комбинированной функции потерь, интегрирующей регрессионные и классификационные критерии. Основные результаты. На примере задачи контроля качества лазерной сварки синтетический набор данных расширен с 120 оригинальных изображений до 4537 реалистичных примеров, что позволило повысить точность сегментации швов с 2,4 до 0,75 по метрике потерь box loss. Для задачи локализации координат шва достигнута ошибка предсказания 31,8 пикселов по оси Y и 3,3 пиксела по оси X на исходном разрешении 1024 × 2448 пикселов. Экспериментальное сравнение показало превосходство сверточных архитектур над трансформерными моделями при сопоставимом количестве параметров, а также лучшую точность при регрессии с одного кадра, чем при использовании последовательности кадров. Обсуждение. Предложенные методы демонстрируют значительное превосходство по сравнению с классическими подходами масштабирования данных (mixup, cutmix) и чистыми подходами к диффузионному синтезу, которые требуют интенсивной подготовки наборов данных. Интеграция эволюционной оптимизации обеспечивает контролируемое разнообразие геометрических вариантов, а диффузионные модели гарантируют фотореалистичность синтезированных образцов. Данный гибридный подход имеет широкие перспективы применения в других промышленных секторах с ограниченной доступностью размеченных данных благодаря возможности построения полного конвейера синтеза труднодоступных промышленных данных, а затем их использования для обучения прикладных методов искусственного интеллекта, решающих целевые промышленные задачи.
Ключевые слова: гибридные методы машинного обучения, эволюционная оптимизация, диффузионные модели, синтетические данные, сверточные нейронные сети, локализация геометрических признаков, контроль качества производства, лазерная сварка, искусственный интеллект
Благодарности. Исследование выполнено за счет гранта Российского научного фонда № 25-11-00367, https://rscf.ru/ project/25-11-00367/.
Список литературы
Благодарности. Исследование выполнено за счет гранта Российского научного фонда № 25-11-00367, https://rscf.ru/ project/25-11-00367/.
Список литературы
1. Xiao S., Liu Z., Yan Z., Wang M. Grad-MobileNet: A gradient-based unsupervised learning method for laser welding surface defect classification // Sensors. 2023. V. 23. N 9. P. 4563. https://doi.org/10.3390/s23094563
2. Vu T., Sun B., Yuan B., Ngai A., Li Y., Frahm J.-M. Supervision interpolation via lossmix: generalizing mixup for object detection and beyond // Proceedings of the AAAI Conference on Artificial Intelligence. 2024. V. 38. N 6. P. 5280–5288. https://doi.org/10.1609/aaai.v38i6.28335
3. Jin X., Zhu H., Li S., Wang Z., Liu Z., Tian J., et al. A survey on mixup augmentations and beyond // arXiv. 2024. arXiv:2409.05202. https://doi.org/10.48550/arXiv.2409.05202
4. Capogrosso L., Girella F., Taioli F., Chiara M., Aqeel M., Fummi F., et al. Diffusion-based image generation for in-distribution data augmentation in surface defect detection // Proc. of the 19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications. 2024. V. 2. P. 409–416. https://doi.org/10.5220/0012350400003660
5. Tai Y., Yang K., Peng T., Huang Z., Zhang Z.Defect image sample generation with diffusion prior for steel surface defect recognition // IEEE Transactions on Automation Science and Engineering. 2024. V. 22. P. 8239–8251. https://doi.org/10.1109/tase.2024.3482362
6. Alzarooni A., Iqbal E., Ullah Khan, S. Javed S., Moyo B., Abdulrahman Y. Anomaly detection for industrial applications: challenges, solutions, and future directions // International Journal of Computer Integrated Manufacturing.2025. https://doi.org/10.1080/0951192X.2025.2599548
7. Bradski G. The openCV library // Dr. Dobb's Journal: Software Tools for the Professional Programmer. 2000. V. 25. N 11. P. 120–123.
8. Zhang Q., Li H. MOEA/D: A multiobjective evolutionary algorithm based on decomposition // IEEE Transactions on Evolutionary Computation. 2007. V. 11. N 6. P. 712–731. https://doi.org/10.1109/tevc.2007.892759
9. Rezatofighi H., Tsoi N., Gwak J., Sadeghian A., Reid I., Savarese S. Generalized intersection over union: A metric and a loss for bounding box regression // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2019. P. 658–666. https://doi.org/10.1109/cvpr.2019.00075
10. Bakurov I., Buzzelli M., Schettini R., Castelli M., Vanneschi L. Structural similarity index (SSIM) revisited: a data-driven approach // Expert Systems with Applications. 2022. V. 189. P. 116087. https://doi.org/10.1016/j.eswa.2021.116087
11. Zhang H., Liu Y., Yang J., Guo W.,Wang X.,Fua P.DiffAtlas: GenAI-Fying atlas segmentation via Image-Mask Diffusion // Lecture Notes in Computer Science. 2025. V. 15975. P. 161–172. https://doi.org/10.1007/978-3-032-05325-1_16
12. Gatys L.A., Ecker A.S., Bethge M. Image style transfer using convolutional neural networks // Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2016. P. 2414–2423. https://doi.org/10.1109/CVPR.2016.265
13. Jiang P., Ergu D., Liu F., Cai Y., Ma B. A Review of Yolo algorithm developments // Procedia Computer Science. 2022. V. 199. P. 1066-1073. https://doi.org/10.1016/j.procs.2022.01.135
14. Chen Y., Lin H., Zhang W., Chen W., Zhou Z., Heidari A.A., et al. ICycle-GAN: Improved cycle generative adversarial networks for liver medical image generation // Biomedical Signal Processing and Control. 2024. V. 92. P. 106100. https://doi.org/10.1016/j.bspc.2024.106100
15. Qin D., Leichner C., Delakis M., Fornoni M., Luo S., Yang F.,et al. MobileNetV4: universal models for the mobile ecosystem // Lecture Notes in Computer Science. 2025. V. 15098. P. 78–96. https://doi.org/10.1007/978-3-031-73661-2_5
16. Graham B., El-Nouby A.,Touvron H., Stock P.,Joulin A.,Jégou H.,et al. LeViT: a vision transformer in convnet’s clothing for faster inference // Proc. of the IEEE/CVF International Conference on Computer Vision (ICCV). 2021. P. 12239–12249. https://doi.org/10.1109/ICCV48922.2021.01204
17. Ma N., Zhang X., Zheng H.-T., Sun J. ShuffleNet V2: practical guidelines for efficient CNN architecture design // Lecture Notes in Computer Science. 2018. V. 11218. P. 122–138. https://doi.org/10.1007/978-3-030-01264-9_8
18. Cai H., Li J., Hu M., Gan C., Han S. EfficientViT: lightweight multi-scale attention for high-resolution dense prediction // Proc. of the IEEE/CVF International Conference on Computer Vision (ICCV). 2023. P. 17256–17267. https://doi.org/10.1109/ICCV51070.2023.01587
19. Khanam R., Hussain M. YOLOv11: an overview of the key architectural enhancements // arXiv. 2024. arXiv:2410.17725. https://doi.org/10.48550/arXiv.2410.17725
20. Hara K., Kataoka H., Satoh Y. Learning spatio-temporal features with 3D residual networks for action recognition // Proc. of the IEEE International Conference on Computer Vision Workshops (ICCVW). 2017. P. 3154–3160. https://doi.org/10.1109/iccvw.2017.373
21. Imambi S., Prakash K.B., Kanagachidambaresan G.R. PyTorch // Programming with TensorFlow: Solution for Edge Computing Applications. 2021. P. 87–104. https://doi.org/10.1007/978-3-030-57077-4_10
22. Loshchilov I., Hutter F. Fixing weight decay regularization in Adam // arXiv. 2017. arXiv:1711.05101v2.
23. Meyer G.P. An alternative probabilistic interpretation of the Huber loss // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2021. P. 5257–5265. https://doi.org/10.1109/cvpr46437.2021.00522
24. Huang P., Tian S., Su Y., Tan W., Dong Y., Xu W., et al. IA-CIOU: an improved IOU bounding box loss function for SAR ship target detection methods // IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing. 2024. V. 17. P. 10569–10582. https://doi.org/10.1109/jstars.2024.3402540
25. Wan E.A., Van Der Merwe R. The unscented Kalman filter for nonlinear estimation // Proc. of the IEEE 2000 Adaptive Systems for Signal Processing, Communications, and Control Symposium (Cat. No.00EX373). 2000. P. 153–158. https://doi.org/10.1109/ASSPCC.2000.882463

