Меню
Публикации
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор
НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
doi: 10.17586/2226-1494-2019-19-3-482-491
УДК 519.25, 004.93+ 621.397.13.037.372
АДАПТИВНОЕ ТРЕХМЕРНОЕ КОСИНУСНОЕ ПРЕОБРАЗОВАНИЕ ТРАНСПОРТНЫХ СЮЖЕТОВ
Читать статью полностью
Ссылка для цитирования:
Аннотация
Хасан Я.А., Фахми Ш.С. Адаптивное трехмерное косинусное преобразование транспортных сюжетов // Научно-технический вестник информационных технологий, механики и оптики. 2019. Т. 19. № 3. С. 482–491. doi: 10.17586/2226-1494-2019-19-3-482-491
Аннотация
Предмет статьи. Предложен метод кодирования и декодирования видеоинформации, полученной из камер видеонаблюдения на транспорте, основанный на использовании адаптивного трехмерного дискретного косинусного преобразования. Сжатие видео, как правило, преследует две цели: уменьшить пространственную избыточность между элементами изображения и временную избыточность между последовательными кадрами. Основным принципом пространственного кодирования является учет корреляции яркостей соседних пикселей, а для межкадрового кодирования основной принцип — использование предсказания и компенсации движения по интерполированным позициям сэмплов в опорном кадре во всех известных стандартных видеокодеках, таких как H.26х и MPEG-х. Метод основан на использовании адаптивного косинусного преобразования в пространстве сигнала и по времени и отличается произвольными размерами кубов в зависимости от пространственных и временных статистических характеристик сигнала изображений. Основные результаты показывают, что предложенный алгоритм может улучшить эффективность кодирования и декодирования изображений с учетом специфики транспортных сюжетов. Высокая производительность достигается при малой и средней интенсивности движения транспортных средств. При этом вычислительная сложность алгоритма уменшается в 4–5 раз при сохранении качества восстановленных видеопотоков по сравнению с стандартными кодеками. Практическая значимость. Предложенные алгоритмы на основе адаптивного косинусного преобразования позволяют, во-первых, уменьшить скорость передачи транспортных видеопоследовательностей в 2–2,5 раза по сравнению с классическим косинусным преобразованием с размером кубов (8×8×8). Во-вторых, существенное сокращение вычислительных затрат при реализации транспортных видеоинформационных систем наблюдения реального времени по сравнению со стандартными кодеками. Результаты работы могут быть рекомендованы специалистам в области кодирования и декодирования видеоинформации для обеспечения необходимой скорости передачи при заданном уровне искажений.
Ключевые слова: сжатие, транспортные видеопотоки, косинусное преобразование, корреляция, вычислительная сложность
Список литературы
Список литературы
1.Turan J., Ovsenik L., Kazimirova Kolesarova A. Video surveillance systems // Acta Electrotechnica et Informatica. 2010. V. 10. N 4. P. 46–53.
2. Фахми Ш.С. Концепция проектирования интеллектуальных транспортных видеосистем на основе технологии «система на кристалле» // Вестник государственного университета морского и речного флота им. адмирала С.О. Макарова. 2013. № 2. С. 79–88.
3. Нгуен В.Ч., Тропченко А.А. Быстрый алгоритм поиска по тестовой зоне для межкадрового кодирования // Научно-технический вестник информационных технологий, механики и оптики. 2017. Т. 17. № 3. С. 483–489. doi: 10.17586/2226-1494-2017-17-3-483-489
4. Tropchenko A., Tropchenko A., Nguyen V.T. Research of block- based motion estimation methods for video compression // Tem Journal-Technology, Education, Management, Informatics. 2016. V. 5. N 3. P. 277–283.
5. Velazquez-Pupo R., Sierra-Romero A., Torres-Roman D. et al. Vehicle detection with occlusion handling, tracking, and OC-SVM classification: a high performance vision-based system // Sensors. 2018. V. 18. N 2. P. 374–385. doi: 10.3390/s18020374
6. Islam K., Raj R. Real-time (vision-based) road sign recognition using an artificial neural network // Sensors. 2017. V. 17. N 4. P. 853–885. doi: 10.3390/s17040853
7. Фахми Ш.С., Еид М.М., Костикова Е.В., Мукало Ю.И., Крюкова М.С., Зайдулин С.М. Классификация транспортных средств в реальном времени // Вопросы радиоэлектроники. Серия: Техника телевидения. 2018. № 3. С. 89–94.
8. Зубакин И.А., Фахми Ш.С. Адаптивный алгоритм кодирования видеоинформации на основе трехмерного дискретного косинусного преобразования // Изв. вузов России. Сер. Радиоэлектроника. 2010. № 1. С. 49−54.
9. Умбиталиев А.А., Цыцулин А.К., Шипилов Н.Н., Ибатуллин С.М., Ибатулин В.Ф., Фахми Ш.С. Способ кодирования и декодирования видеоинформации на основе трехмерного дискретного косинусного преобразования. Патент РФ № 2375838. Опуб. 10.12.2009, Бюл. 34.
10. Fahmi Sh.S., Ibatullin S.M. et al. A versatlie real time video codec based on three-dimensional discrete cosine transform // RAI International Exhibition and Congress Centre. Amsterdam, The Netherlands, 2008. P. 386–391.
11. Masram B.Y., Karule P.T. High speed 3D-DCT/IDCT CORDIC algorithm for DSP application // European Journal of Advances in Engineering and Technology. 2017. V. 4. N 12. Р. 941–950.
12. Servais M., de Jager G., Video compression using the three dimensional discrete cosine transform (3D-DCT) // Proc. South African Symposium on Communications and Signal Processing. Grahamstown, South Africa, 1997. P. 27–32. doi: 10.1109/comsig.1997.629976
13. Ричардсон Я. Видеокодирование. H.264 и MPEG-4 – стандарты нового поколения. М.: Техносфера, 2005. 368 с.
14. Цыцулин А.К., Фахми Ш.С., Колесников Е.И., Очкур С.В. Функционал взаимообмена сложности и точности систем кодирования непрерывного сигнала // Информационные технологии. 2011. № 4. С. 71–77.
15. Моисеев Н.Н. Математические задачи системного анализа. М.: Наука, 1981. 488 с.
16. Lee M.C., Chan K.W., Adjeroh D.A. Quantization of 3D-DCT coefficients and scan order for video compression // Journal of Visual Communication and Image Representation. 1997. V. 8. N 4. P. 405–422. doi: 10.1006/jvci.1997.0365
17. Bozinovic N., Konrad J. Scan order and quantization for 3D-DCT coding // Proc. Visual Communications and Image Processing. Lugano, Switzerland, 2003. V. 5150. P. 1204–1215. doi: 10.1117/12.503324
18. Peterson H.A., Ahumada A.J., Watson A.B. An improved detection model for DCT coefficient quantization // SPIE Proceedings. 1993. V. 1913. P. 191–201. doi: 10.1117/12.152693
19. Хромов Л.И. Информационная теория связи на пороге XXI века. СПб.: НИИТ, 1996. 88 с.
20. Альмахрук М.М., Бобровский А.И., Еид М.М., Соко- лов Ю.М., Салем А., Фахми Ш.С. Точность, скорость и сложность устройств кодирования изображений по опорным точкам // Научно-технический вестник информационных технологий, механики и оптики. 2016. Т. 16. № 4. С. 678–689. doi: 10.17586/2226-1494-2016-16-4-678-688
21. Крюкова М.С., Фахми Ш.С. и др. Методы, алгоритмы ко- дирования и классификация изображений морских судов // Морские интеллектуальные технологии. 2019. Т. 3. № 1(43). С. 145-155.
22. Зубакин И.А., Фахми Ш.С. Классификация нестационарных изображений и разработка методики оценки алгоритмов кодирования источника // Науч. тех. вестник СПбГУ ИТМО. 2010. № 2(66). С. 54–59.
2. Фахми Ш.С. Концепция проектирования интеллектуальных транспортных видеосистем на основе технологии «система на кристалле» // Вестник государственного университета морского и речного флота им. адмирала С.О. Макарова. 2013. № 2. С. 79–88.
3. Нгуен В.Ч., Тропченко А.А. Быстрый алгоритм поиска по тестовой зоне для межкадрового кодирования // Научно-технический вестник информационных технологий, механики и оптики. 2017. Т. 17. № 3. С. 483–489. doi: 10.17586/2226-1494-2017-17-3-483-489
4. Tropchenko A., Tropchenko A., Nguyen V.T. Research of block- based motion estimation methods for video compression // Tem Journal-Technology, Education, Management, Informatics. 2016. V. 5. N 3. P. 277–283.
5. Velazquez-Pupo R., Sierra-Romero A., Torres-Roman D. et al. Vehicle detection with occlusion handling, tracking, and OC-SVM classification: a high performance vision-based system // Sensors. 2018. V. 18. N 2. P. 374–385. doi: 10.3390/s18020374
6. Islam K., Raj R. Real-time (vision-based) road sign recognition using an artificial neural network // Sensors. 2017. V. 17. N 4. P. 853–885. doi: 10.3390/s17040853
7. Фахми Ш.С., Еид М.М., Костикова Е.В., Мукало Ю.И., Крюкова М.С., Зайдулин С.М. Классификация транспортных средств в реальном времени // Вопросы радиоэлектроники. Серия: Техника телевидения. 2018. № 3. С. 89–94.
8. Зубакин И.А., Фахми Ш.С. Адаптивный алгоритм кодирования видеоинформации на основе трехмерного дискретного косинусного преобразования // Изв. вузов России. Сер. Радиоэлектроника. 2010. № 1. С. 49−54.
9. Умбиталиев А.А., Цыцулин А.К., Шипилов Н.Н., Ибатуллин С.М., Ибатулин В.Ф., Фахми Ш.С. Способ кодирования и декодирования видеоинформации на основе трехмерного дискретного косинусного преобразования. Патент РФ № 2375838. Опуб. 10.12.2009, Бюл. 34.
10. Fahmi Sh.S., Ibatullin S.M. et al. A versatlie real time video codec based on three-dimensional discrete cosine transform // RAI International Exhibition and Congress Centre. Amsterdam, The Netherlands, 2008. P. 386–391.
11. Masram B.Y., Karule P.T. High speed 3D-DCT/IDCT CORDIC algorithm for DSP application // European Journal of Advances in Engineering and Technology. 2017. V. 4. N 12. Р. 941–950.
12. Servais M., de Jager G., Video compression using the three dimensional discrete cosine transform (3D-DCT) // Proc. South African Symposium on Communications and Signal Processing. Grahamstown, South Africa, 1997. P. 27–32. doi: 10.1109/comsig.1997.629976
13. Ричардсон Я. Видеокодирование. H.264 и MPEG-4 – стандарты нового поколения. М.: Техносфера, 2005. 368 с.
14. Цыцулин А.К., Фахми Ш.С., Колесников Е.И., Очкур С.В. Функционал взаимообмена сложности и точности систем кодирования непрерывного сигнала // Информационные технологии. 2011. № 4. С. 71–77.
15. Моисеев Н.Н. Математические задачи системного анализа. М.: Наука, 1981. 488 с.
16. Lee M.C., Chan K.W., Adjeroh D.A. Quantization of 3D-DCT coefficients and scan order for video compression // Journal of Visual Communication and Image Representation. 1997. V. 8. N 4. P. 405–422. doi: 10.1006/jvci.1997.0365
17. Bozinovic N., Konrad J. Scan order and quantization for 3D-DCT coding // Proc. Visual Communications and Image Processing. Lugano, Switzerland, 2003. V. 5150. P. 1204–1215. doi: 10.1117/12.503324
18. Peterson H.A., Ahumada A.J., Watson A.B. An improved detection model for DCT coefficient quantization // SPIE Proceedings. 1993. V. 1913. P. 191–201. doi: 10.1117/12.152693
19. Хромов Л.И. Информационная теория связи на пороге XXI века. СПб.: НИИТ, 1996. 88 с.
20. Альмахрук М.М., Бобровский А.И., Еид М.М., Соко- лов Ю.М., Салем А., Фахми Ш.С. Точность, скорость и сложность устройств кодирования изображений по опорным точкам // Научно-технический вестник информационных технологий, механики и оптики. 2016. Т. 16. № 4. С. 678–689. doi: 10.17586/2226-1494-2016-16-4-678-688
21. Крюкова М.С., Фахми Ш.С. и др. Методы, алгоритмы ко- дирования и классификация изображений морских судов // Морские интеллектуальные технологии. 2019. Т. 3. № 1(43). С. 145-155.
22. Зубакин И.А., Фахми Ш.С. Классификация нестационарных изображений и разработка методики оценки алгоритмов кодирования источника // Науч. тех. вестник СПбГУ ИТМО. 2010. № 2(66). С. 54–59.