doi: 10.17586/2226-1494-2019-19-3-546-552


УДК 004.855.5

АНАЛИЗ ВЛИЯНИЯ РАЗЛИЧНОЙ РАЗМЕРНОСТИ ФИЛЬТРОВ СВЕРТОЧНОГО СЛОЯ НА ТОЧНОСТЬ КЛАССИФИКАЦИИ ДОРОЖНЫХ ЗНАКОВ

Сичкар В.Н., Колюбин С.А.


Читать статью полностью 
Ссылка для цитирования:
Сичкар В.Н., Колюбин С.А. Анализ влияния различной размерности фильтров сверточного слоя на точность классификации дорожных знаков // Научно-технический вестник информационных технологий, механики и оптики. 2019. Т. 19. № 3. С. 546–552. doi: 10.17586/2226-1494-2019-19-3-546-552
 


Аннотация
Выполнено исследование эффективного метода классификации дорожных знаков на основе сверточной нейронной сети с фильтрами различной размерности. Каждая модель сверточной нейронной сети имеет одинаковую архитектуру, но разную размерность фильтров для сверточного слоя. Исследуемыми размерностями фильтров сверточного слоя являются 3 × 3, 5 × 5, 9 × 9, 13 × 13, 15 × 15, 19 × 19, 23 × 23, 25 × 25 и 31 × 31. В каждом эксперименте входное изображение подвергается операции свертки фильтрами определенной размерности и с определенной глубиной обработки границ изображения, которая прямо пропорционально зависит от размерности фильтров и варьируется в пределах от 1 до 15 пикселей. Характеристики предложенных методов оцениваются с помощью немецкого набора изображений дорожных знаков (GTSRB). Изображения из данного набора были уменьшены в размерности до 32 × 32 пикселей. Весь набор данных с изображениями был разделен на три части: набор для обучения, набор для валидации и набор для тестирования. Влияние размерности фильтров сверточного слоя на извлеченные карты характеристик анализируется в соответствии с точностью классификации и средним временем обработки. Набор данных для тестирования содержит 12000 изображений, которые не принимают участия в обучении сверточной нейронной сети. Результаты экспериментов показали, что каждая из моделей обладает высокой точностью классификации, которая составляет более 82 %. Модели с размерностью фильтров 9 × 9, 15 × 15 и 19 × 19 вошли в первую тройку с лучшими результатами по точности классификации, которая составила 86,4, 86 и 86,8 % соответственно. Модели с размерностью фильтров 5 × 5, 3 × 3 и 13 × 13 вошли в первую тройку с лучшими результатами по средней скорости обработки, которая составила 0,001879, 0,002046 и 0,002364 секунд соответственно. Использование средней размерности фильтров для сверточного слоя показало не только высокую точность классификации более 86 %, но и высокую скорость классификации, что позволяет использовать такие модели в приложениях для работы в реальном времени.

Ключевые слова: классификация дорожных знаков, сверточная нейронная сеть, фильтры сверточного слоя, извлечение карт характери- стик, точность классификации

Список литературы
1. Balali V., Ashouri Rad A., Golparvar-Fard M. Detection, classification, and mapping of U.S. traffic signs using google street view images for roadway inventory management
// Visualization in Engineering. 2015. V. 3. N 1. doi: 10.1186/s40327-015-0027-1
2. Lu Y., Lu J., Zhang S., Hall P. Traffic signal detection and classification in street views using an attention model // Computational Visual Media. 2018. V. 4. N 3. P. 253–266. doi: 10.1007/s41095-018-0116-x
3. Balali V., Golparvar-Fard M. Segmentation and recognition of roadway assets from car-mounted camera video streams using a scalable non-parametric image parsing method // Automation in Construction. 2016. V. 49. P. 27–39. doi: 10.1016/j.autcon.2014.09.007
4. Khalilikhah M., Heaslip K. The effects of damage on sign visibility: an assist in traffic sign replacement // Journal of Traffic and Transportation Engineering. 2016. V. 3. N 6. P. 571–581. doi: 10.1016/j.jtte.2016.03.009
5. Kryvinska N., Poniszewska-Maranda A., Gregus M. An approach towards service system building for road traffic signs detection and recognition // Procedia Computer Science. 2018. V. 141. P. 64–71. doi: 10.1016/j.procs.2018.10.150
6. Khalilikhah M., Heaslip K. Analysis of factors temporarily impacting traffic sign readability // International Journal of Transportation Science and Technology. 2016. V. 5. N 2. P. 60– 67. doi: 10.1016/j.ijtst.2016.09.003
7. Shustanov A., Yakimov P. CNN design for real-time traffic sign recognition // Procedia Engineering. 2017. V. 201. P. 718–725. doi: 10.1016/j.proeng.2017.09.594
8. Indolia S., Kumar Goswami A., Mishra S.P., Asopa P. Conceptual understanding of convolutional neural network – a deep learning approach // Procedia Computer Science. 2018. V. 132. P. 679– 688. doi: 10.1016/j.procs.2018.05.069
9. Ozturk S., Akdemir B. Effects of histopathological image pre-processing on convolutional neural networks // Procedia Computer Science. 2018. V. 132. P. 396–403. doi: 10.1016/j.procs.2018.05.166
10. Kurniawan J., Syahra S.G.S., Dewa C.K., Afiahayati. Traffic congestion detection: learning from CCTV monitoring images using convolutional neural network // Procedia Computer Science. 2018. V. 144. P. 291–297. doi: 10.1016/j.procs.2018.10.530
11. Aghdam H.H., Heravi E.J., Puig D. A practical approach for detection and classification of traffic signs using Convolutional Neural Networks // Robotics and Autonomous Systems. 2016. V. 84. P. 97–112. doi: 10.1016/j.robot.2016.07.003
12. Stallkamp J., Schlipsing M., Salmen J., Igel C. The German traffic sign recognition benchmark: a multi-class classification competition // Proc. Int. Joint Conference on Neural Networks. San Jose, USA, 2011. P. 1453–1460. doi: 10.1109/IJCNN.2011.6033395
13. Houben S., Stallkamp J., Salmen J., Schlipsing M., Igel C. Detection of traffic signs in real-world images: the german traffic sign detection benchmark // Proc. Int. Joint Conference on Neural Networks. Dallas, USA, 2013. P. 1–8. doi: 10.1109/ IJCNN.2013.6706807
14. Eckle K., Schmidt-Hieber J. A comparison of deep networks with ReLU activation function and linear spline-type methods // Neural Networks. 2019. V. 110. P. 232–242. doi: 10.1016/j.neunet.2018.11.005
15. Lin G., Shen W. Research on convolutional neural network based on improved Relu piecewise activation function // Procedia Computer Science. 2018. V. 131. P. 977–984. doi: 10.1016/j.procs.2018.04.239
 


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика