doi: 10.17586/2226-1494-2024-24-5-849-857

УДК 004.491

Обнаружение скрытого вредоносного программного обеспечения с использованием глубокой нейронной сети с выбором признаков ANOVA на наборе данных CIC‑MalMem-2022

Хаджила М., Мерзуг М., Ферхи В., Муссауи Д., Буйден А., Хашеми М.

Язык статьи - английский

Ссылка для цитирования:
Хаджила М., Мерзуг М., Ферхи В., Муссауи Д., Буйден А.Б., Хашеми М.Х. Обнаружение скрытого вредоносного программного обеспечения с использованием глубокой нейронной сети с выбором признаков ANOVA на наборе данных CIC-MalMem-2022 // Научно-технический вестник информационных технологий, механики и оптики. 2024. Т. 24, № 5. С. 849–857 (на англ. яз.). doi: 10.17586/2226-1494-2024-24-5-849-857

Анализ вредоносного программного обеспечения включает исследование функциональности, поведения и потенциальных рисков. Искусственный интеллект и глубокое обучение открывают возможности автоматизированного, интеллектуального и адаптивного анализа вредоносного программного обеспечения. В работе предлагается модель глубокой нейронной сети (Deep Neural Network, DNN), созданная на основе признаков, выбранных с помощью F-теста дисперсионного анализа (ANalysis Of VAriance, ANOVA), для повышения точности распознавания путем выявления информативных признаков. DNN-ANOVA представляет собой метод выбора признаков, используемый для анализа числовых входных данных, когда целевая переменная является категориальной. К наиболее релевантным признакам относятся те, значения оценки которых превышают определенный порог, равный отношению суммы оценок всех признаков к общему числу признаков. Эксперименты выполнены на наборе данных CIC-MalMem-2022. Проведен анализ обнаружения или отсутствия вредоносного программного обеспечения с использованием бинарной классификации, а также полиномиальной классификации для определения его типа. Согласно результатам F-теста, модель DNN-ANOVA достигает наилучших значений: 100 % — precision, 99,99 % — accuracy, 99, 99 % — F1-score и 99,98 % — recall для бинарной классификации. Кроме того, DNN-ANOVA превосходит текущие работы с общим показателем точности (accuracy) 85,83 % для групповых атак и 73,98 % для индивидуальных атак в случае полиномиальной классификации.

Ключевые слова: обнаружение вредоносного программного обеспечения, глубокое обучение, выбор признаков ANOVA, бинарная классификация, полиномиальная классификация, набор данных

