DOI: 10.17586/2226-1494-2018-18-3-428-436


УДК004.93, 57.087.1

МЕТОДЫ ДЕТЕКТИРОВАНИЯ СПУФИНГ-АТАК ПОВТОРНОГО ВОСПРОИЗВЕДЕНИЯ НА ГОЛОСОВЫЕ БИОМЕТРИЧЕСКИЕ СИСТЕМЫ

Лаврентьева Г. М., Новосёлов С. А., Козлов А. В., Кудашев О. Ю., Щемелинин В. Л., Матвеев Ю. Н., Де Марсико М. .


Язык статьи - русский

Ссылка для цитирования: Лаврентьева Г.М., Новосёлов С.А., Козлов А.В., Кудашев, О.Ю. Щемелинин В.Л., Матвеев Ю.Н., Де Марсико М. Методы детектирования спуфинг-атак повторного воспроизведения на голосовые биометрические системы // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18. № 3. С. 428–436. doi: 10.17586/2226-1494-2018-18-3-428-436

Аннотация

Предмет исследования. Исследована задача детектирования атак повторного воспроизведения на голосовые биометрические системы. Подобные атаки, в силу простоты своей реализации, с большей вероятностью используются злоумышленниками и поэтому представляют собой особую опасность. В данной работе описана система детектирования атак повторного воспроизведения, которая была представлена на конкурсе ASVspoof2017 по этой проблеме. Метод. Исследована эффективность подхода на основе глубоких нейронных сетей для решения описанной задачи, в частности, конволюционных нейронных сетей с Max-Feature-Map активационной функцией.Основные результаты. Результаты экспериментов на базе конкурса показали, что предложенный подход превосходит современные методы по качеству детектирования спуфинг-атак. Лучшая представленная система продемонстрировала ошибку EER, равную 6,73% на подмножестве неизвестных атак, что на 72% лучше базового метода, представленного на конкурсе. Практическая значимость. Результаты работы могут найти применение в области голосовой биометрии. Представленные методы могут быть использованы в системах автоматической верификации и идентификации дикторов по голосу для детектирования атак с целью взлома.


Ключевые слова: спуфинг, детектирование атак повторного воспроизведения, CNN, RNN, ASVspoof

Благодарности. Работа выполнена в рамках темы ПНИЭР «Разработка технологии автоматической бимодальной верификации по лицу и голосу с защитой от использования подложных биометрических образцов» при финансовой поддержке Министерства образования и науки Российской Федерации по соглашению о предоставлении субсидии №14.578.21.0189 от 03.10.2016 RFMEFI57816X0189.

Список литературы
  1. Sebastien M., Nixon M.S., Li S.Z. Handbook of Biometric Anti-Spoofing: Trusted Biometrics under Spoofing Attacks. Springer, 2014. 281 p. doi: 10.1007/978-1-4471-6524-8
  2. Faundez-Zanuy M., Hagmuller M., Kubin G. Speaker verification security improvement by means of speech water-marking // Speech Communication. 2006. V. 48. N 12. P. 1608–1619. doi: 10.1016/j.specom.2006.06.010
  3. Wu Z., Evans N., Kinnunen T., Yamagishi J., Alegre F., Li H. Spoofing and countermeasures for speaker verification: A survey // Speech Communication. 2005. V. 66. P. 130–153.doi: 10.1016/j.specom.2014.10.005
  4. Wu Z., Kinnunen T., Evans N., Yamagishi J., Hanilci C., Sahidullah M., Sizov A. ASVspoof: the automatic speaker verification spoofing and countermeasures challenge // IEEE Journal of Selected Topics in Signal Processing. 2017. V. 11. N 4. P. 588–604. doi: 10.1109/JSTSP.2017.2671435
  5. Villalba J., Lleida E. Preventing replay attacks on speaker verification systems // Proc. IEEE Int. Carnahan Conf. on Security Technology. Barcelona, Spain, 2011. 8 p. doi: 10.1109/CCST.2011.6095943
  6. Kinnunen T., Sahidullah M., Delgado H., Todisco M., Evans, N., Yamagishi J.,Lee K.A. The ACVspoof 2017 challenge: Assessing the limits of replay spoofing
    attack detection // Proc. of Interspeech. Stockholm, Sweden, 2017. P. 2–6. doi: 10.21437/Interspeech.2017-1111
  7. Karpathy A., Toderici G., Shetty S., Leung T., Sukthankar R., Li F.F. Large-scale video classification with convolutional neural networks // Proc. IEEE Conf. on Computer Vision and Pattern Recognition. Columbus, USA, 2014. P. 1725–1732. doi: 10.1109/CVPR.2014.223
  8. Bengio Y., Courville A., Vincent P. Representation learning: a review and new perspectives // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2013. V. 35. N 8.
    P. 1798–1828. doi: 10.1109/TPAMI.2013.50
  9. Krizhevsky A., Sutskever I., Hinton G. E. ImageNet classification with deep convolutional neural networks // Advances in Neural Information Processing Systems. 2012. V. 2. P. 1097–1105.
  10. Taigman Y., Yang M., Ranzato M., Wolf L. Deepface: Closing the gap to human-level performance in face verification // Proc. IEEE Conference on Computer Vision and Pattern Recognition. Columbus, USA, 2014. P. 1701–1708. doi: 10.1109/CVPR.2014.220
  11. Волкова С.С., Матвеев Ю.Н. Применение сверточных нейронных сетей для решения задачи противодействия атаке спуфинга в системах лицевой биометрии // Научно-технический вестник информационных технологий, механики и оптики. 2017. Т. 17. № 4. С. 702–710. doi: 10.17586/2226-1494-2017-17-4-702-710
  12. Zhang C., Yu C., Hansen J.H.L. An investigation of deep-learning frameworks for speaker verification anti-spoofing // IEEE Journal of Selected Topics in Signal Processing. 2017. V. 11. N 4. P. 684–694. doi: 10.1109/JSTSP.2016.2647199
  13. Tian X., Xiao X., Siong C. E., Li H. Spoofing speech detection using temporal convolutional neural network // Proc. of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference. Jeju, South Korea, 2016. doi: 10.1109/APSIPA.2016.7820738
  14. Lee K.A., Larcher A., Wang G. et al. The RedDots data collection for speaker recognition // Proc. of Interspeech. Dresden, Germany, 2015. P. 2996–3000.
  15. Todisco M., Delgado H., Evans N. A new feature for automatic speaker verification antispoofing: Constant Q cepstral coefficients // Proc. Odyssey. Bilbao, Spain, 2016. doi: 10.21437/odyssey.2016-41
  16. Lavrentyeva G., Novoselov S., Malykh E., Kozlov A., Kudashev O., Shchemelinin V. Audio replay attack detection with deep learning frameworks // Proc. of Interspeech. Stockholm, Sweden, 2017. P. 82–86. doi: 10.21437/Interspeech.2017-360
  17. Wu X., He R., Sun Z., Tan T. A light CNN for deep face representation with noisy labels // arXiv: 1511.02683. 2015. 13 p.
  18. Chung J., Gulcehre C., Cho K., Bengio Y. Empirical evaluation of gated recurrent neural networks on sequence modeling // arXiv:1412.3555. 2014.
Информация 2001-2018 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика