DOI: 10.17586/2226-1494-2018-18-2-299-306


УДК004.932.2

ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОПРЕДЕЛЕНИЯ НАРУШЕНИЙ ЦЕЛОСТНОСТИ JPEG-ИЗОБРАЖЕНИЙ

Серова А. И., Спивак А. И.


Язык статьи - русский

Ссылка для цитирования: Серова А.И., Спивак А.И. Использование методов машинного обучения для определения нарушений целостности JPEG-изображений // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18. № 2. С. 299–306. doi: 10.17586/2226-1494-2018-18-2-299-306

Аннотация

Предмет исследования. Проведено исследование нарушений целостности изображений и существующих методов их определения. Предложен метод, позволяющий определять модифицированное изображение, а также источник его модификации. Метод позволяет определять оригинальное изображение и модель камеры, на которую оно было снято. Метод. В предлагаемом методе использованыинструменты машинного обучения. Исследованы следующие методы машинного обучения: наивный байесовский классификатор, дерево решений, логистическая регрессия, k-ближайших соседей, SVC, randomforest. База для обучения модели была образована оригинальными изображениями с веб-сайта www.steves-digicams.com, модифицированными с помощью различных графических редакторов. Предложенный метод использует структуру JPEG-изображения в байтовом представлении, а именно маркеры. В качестве признаков для классификации выступали наличие маркеров и их количество. Основные результаты. Обученная модель показала высокий результат классификации – более 95%. Среди исследованных алгоритмов два показали наилучшие результаты – дерево решений и randomforest, по критерию стабильности было выбрано дерево решений. Практическая значимость. Полученный результат может быть применен на практике в таких областях, как криминалистика и информационная безопасность.


Ключевые слова: машинное обучение, изображения, целостность, информационная безопасность, JPEG

Список литературы
 
  1. Хатунцев Н.А., Лизоркин А.М. Метод доказывания неизменности фотоизображений в рамках компьютерно-технической экспертизы (на примере из экспертной практики) // Теория и практика судебной экспертизы. 2014. № 3. С. 69–73.
  2. Farid H. Digital Image Ballistics from JPEG Quantization: A Followup Study. Technical ReportTR2008-638.Dartmouth College, 2008,6 p.
  3. Photo Tampering throughout History [Электронныйресурс]. Режим доступа: http://pth.izitru.com/1994_02_00.html, своб. (дата обращения: 20.10.2017).
  4. Щербаков С. Метаданные в цифровой фотографии [Электронный ресурс]. 2005. Режим доступа: www.ixbt.com/digimage/metadxph.shtml, своб. (дата обращения: 20.10.2017).
  5. Федотов Н.Н. Форензика – компьютерная криминалистика. М.: Юридический Мир, 2007. 432 с.
  6. Beck T. How to Detect Image Manipulations? [Электронныйресурс]. 2017. Режимдоступа: headt.eu/detect-image-manipulations, своб. (дата обращения: 30.10.2017).
  7. Color Adjustment: HSV colorspace [Электронныйресурс]. Режимдоступа: fotoforensics.com/tutorial-coloradjustment.php (датаобращения: 30.10.2017).
  8. Recommendation T.81. Information technology – digital compression and coding of continuous-tone still images. Part 1. Requirements and guidelines. CCITT, 1993. 186 p.
  9. Ватолин Д.С. Алгоритмы сжатия изображений. М.: МГУ, 1999.76 с.
  10. Шелепов М.И. История создания, устройство, строение и применение графического формата JPEG[Электронный ресурс]. Режим доступа: www.kolpinkurs.ru/stati/jpeg.htm, своб. (дата обращения: 25.10.2017).
  11. Domingos P. A few useful things to know about machine learning // Communications of the ACM. 2012. V. 55. N 10. P. 78–87.doi: 10.1145/2347736.2347755
  12. Pedregosa F., Varoquaux G., Gramfort A. et al. Scikit-learn: machine learning in python // Journal of Machine Learning Research. 2011. V. 12. P. 2825–2830.
  13. Cai Y.I., Ji D., Cai D.F. A KNN research paper classification method based on shared nearest neighbor // Proc. NTCIR-8 Workshop Meeting. Tokyo, 2010. 5 p.
  14. Quinlan J.R. Induction of decision trees // Machine Learning. 1986. V. 1. N 1. P. 81–106.doi: 10.1023/A:1022643204877
  15. Hsu C.W., Chang C.C., Lin C.J.A Practical Guide to Support Vector Classification. [Электронный ресурс]. 2016. URL: www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf (дата обращения: 25.10.2017).
  16. Ali J., Khan R., Ahmad N., Maqsood I. Random forests and decision trees // IJCSI International Journal of Computer Science. 2012. V. 9. N 5. P. 272–278.


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2018 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика