НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
doi: 10.17586/2226-1494-2019-19-4-622-629
УДК 004.896
ЛОКАЛИЗАЦИЯ МОБИЛЬНОГО РОБОТА С ФИЛЬТРОМ ЧАСТИЦ ПРИ ОБНАРУЖЕНИИ И СЕГМЕНТАЦИЕЙ ОБЪЕКТОВ
Читать статью полностью
Ссылка для цитирования:
Аннотация
Предмет исследования. Предложен метод локализации мобильного робота с использованием фильтра частиц (метода Монте-Карло), основанный на компьютерном зрении. Алгоритм локализации использует отличительные ориентиры, которые понятны человеку. Семантическая информация используется в модели движения с данными о дальности и без них. Метод. Принцип работы модифицированного алгоритма локализации заключается в использовании семантических подсказок высокого уровня. Вместо выдавливания плана этажа в третье измерение производится свертка трехмерного мира в двухмерное представление и выборка дискриминационных ориентиров высокого уровня. Этот подход используется для представления глобальной локализации, которая опирается исключительно на семантические метки, присутствующие в плане этажа и извлеченные из изображений RGB. Основные результаты. В работе продемонстрировано, что локализация с сегментацией объектов, основанная на отличительных ориентирах, является эффективной альтернативой традиционному сканированию. Исследование производится в наборе данных плана этажа, а также проводится сравнение нескольких подходов с точки зрения качественной и количественной оценки локализации на уровне комнаты и глобальной локализации. Продемонстрировано, что семантическая информация дополняет современные методы, обеспечивая снижение ошибок до 35 %. Практическая значимость. Представлена новая структура восприятия и локализации, которая использует семантические данные и информацию о расстояниях. Новая платформа может быть использована для локализации как превосходящая традиционные алгоритмы, основанные на методе Монте-Карло.
Список литературы
-
Liu C., Schwing A.G., Kundu K., Urtasun R., Fidler S. Rent3D: Floor-plan priors for monocular layout estimation // Proc. IEEE Conf. on Computer Vision and Pattern Recognition. 2015. doi: 10.1109/CVPR.2015.7298963
-
Thrun S., Fox D., Burgard W., Dellaert F. Robust Monte Carlo localization for mobile robots // Artificial Intelligence. 2001. V. 128. N 1-2. P. 99–141. doi: 10.1016/S0004-3702(01)00069-8
-
Dellaert F. Using the Condensation algorithm for robust, vision-based mobile robot localization // Proc. IEEE Conf. on Computer Vision and Pattern Recognition. 1999. P. 10–12. doi: 10.1109/CVPR.1999.784976
-
Brubaker M.A., Geiger A., Urtasun R. Lost! Leveraging the crowd for probabilistic visual self-localization // Proc. IEEE Conf. on Computer Vision and Pattern Recognition. 2013. P. 10–16. doi: 10.1109/CVPR.2013.393
-
ChuH., Kim D.K., Chen T. You are here: mimicking the human thinking process in reading floor-plans // Proc. IEEE Int. Conf. on Computer Vision. 2015. doi: 10.1109/ICCV.2015.255
-
Briechle K., Hanebeck U.D. Localization of a mobile robot usingrelative bearing measurements // IEEE Transactions on Robotics and Automation. 2002. V. 20. N 1. P. 36–44. doi: 10.1109/TRA.2003.820933
-
Thrun S. Probabilistic robotics // Communications of the ACM. 2002. V. 45. N 3. doi: 10.1145/504729.504754
-
Badrinarayanan V. SegNet: a deep convolutional encoder-decoder architecture for image segmentation // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017. V. 39. N 13. P. 2481–2495. doi: 10.1109/TPAMI.2016.2644615
-
Shelhamer E., Long J., Darrell T. Fully convolutional networks for semantic segmentation // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017. V. 39. N 13. P. 640–651. doi: 10.1109/TPAMI.2016.2572683
-
Tateno K., Tombari F., Laina I., Navab N. CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction // Proc. IEEE Conf. on Computer Vision and Pattern Recognition. 2017. doi: 10.1109/cvpr.2017.695
-
LainaI., Rupprecht C., Belagiannis V. Deeper depth prediction with fully convolutional residual networks // Proc. 4th Int. Conf. on 3D Vision. 2016. doi: 10.1109/3dv.2016.32
-
Kendall A., Badrinarayanan V., Cipolla R. Bayesian Seg Net: model uncertainty in deep convolutional encoder-decoder architectures for scene understanding // Proceedings of the British Machine Vision Conference. 2017. doi: 10.5244/c.31.57
-
Xiao J., Owens An., Torralba A. SUN3D: A database of big spaces reconstructed using SfM and object labels // Proc. IEEE Int. Conf. on Computer Vision. 2013. doi: 10.1109/ICCV.2013.458
-
Blanco J.L. Optimal filtering for non-parametric observation models: applications to localization and SLAM // The International Journal of Robotics Research. 2010. V. 29. N 14. P. 1726–1742. doi: 10.1177/0278364910364165
-
Sturm J., Engelhard N., Endres F., Burgard W., Cremers D. A benchmark for the evaluation of RGB-D SLAM systems // IEEE/RSJ Int. Conf. on Intelligent Robots and Systems. 2012. doi: 10.1109/iros.2012.6385773
-
Labbe M., Michaud F. Online global loop closure detection for large-scale multi-session graph-based SLAM // IEEE/RSJ Int. Conf. on Intelligent Robots and Systems. 2014. doi: 10.1109/iros.2014.6942926
-
Horn B.K.P. Closed-form solution of absolute orientation using unit quaternions // JOSA A. 1987. V. 4. N 4. P. 629. doi: 10.1364/JOSAA.4.000629