Аннотации номера

ОБЗОРНЫЕ СТАТЬИ

669
Введение. Представлен обзор современных методов и технологий автоматического машинного сурдоперевода, включающих распознавание и синтез как звучащей, так и жестовой речи. Рассмотренные методы предназначены для обеспечения эффективной коммуникации между глухими, слабослышащими и слышащими людьми. Предложенные решения могут найти применение в современных интерфейсах человеко-машинного взаимодействия. Методы. Рассмотрены ключевые аспекты новых технологий, включая методы распознавания и синтеза жестовой речи и аудиовизуальной речи, существующие наборы данных для обучения нейросетевых моделей, а также современные системы автоматического машинного сурдоперевода. Представлены актуальные нейросетевые подходы, включающие использование методов глубокого обучения, таких как сверточные и рекуррентные нейросети, а также трансформеры. Приведен анализ существующих наборов данных для обучения систем распознавания и синтеза речи, проблем и ограничений существующих систем машинного сурдоперевода. Основные результаты. Выявлены основные недостатки и конкретные проблемы текущих технологий автоматического машинного сурдоперевода. Определены перспективные пути их решения. Особое внимание уделено возможности применения автоматических систем машинного сурдоперевода в реальных условиях. Обсуждение. Показана необходимость дальнейших исследований в области сбора и разметки данных. Доказана целесообразность разработки новых методов и нейросетевых моделей, а также создания инновационных технологий для обработки аудио- и видеоданных с целью улучшения качества и эффективности существующих систем автоматического машинного сурдоперевода.
687
Введение. В работе исследованы алгоритмы маршрутизации для сетей на кристалле (СенК). Приведен анализ существующих алгоритмов маршрутизации, выделены их ограничения и области применения. Оценка алгоритмов проведена с учетом требований конкретных приложений и особенностей архитектур. Представлены результаты сравнения производительности рассматриваемых алгоритмов. Метод. Анализ и сравнение различных алгоритмов маршрутизации для СенК проведены с учетом критически важных характеристик. Основное внимание уделено таким алгоритмам маршрутизации, как детерминированный XY-алгоритм, алгоритм поворота модели, маршрутизация с учетом перегрузок, отказоустойчивая маршрутизация, маршрутизация с учетом «качества услуги», алгоритм муравьиной колонии. Показано, что выбор алгоритма маршрутизации должен основываться на специфических требованиях и условиях использования сети. Показана важность адаптации к разнообразным условиям и задачам, с которыми могут столкнуться пользователи и разработчики СенК. Основные результаты. С использованием данных из существующих исследований проведен анализ алгоритмов на основе нескольких ключевых показателей: задержка, пропускная способность, адаптивность, отказоустойчивость и сложность реализации. Выявлены сильные и слабые стороны каждого алгоритма в различных сценариях использования и при разной нагрузке на сеть. Показано, что выбор алгоритма маршрутизации должен опираться на конкретные требования и условия использования сети, а также на баланс между производительностью, адаптивностью, отказоустойчивостью и сложностью реализации. Обсуждение. Исследование вносит вклад в понимание эффективности различных алгоритмов маршрутизации в СенК. Предоставлены рекомендации для их выбора в зависимости от специфических требований приложения и архитектуры системы. Исследование способствует углублению понимания влияния алгоритмов маршрутизации на общую эффективность СенК. Предложены направления дальнейших усовершенствований в этой области. Результаты работы могут быть применены при проектировании и разработке высокопроизводительных многопроцессорных систем на кристалле, где эффективная маршрутизация данных между различными компонентами системы является ключевым фактором обеспечения высокой производительности. Подчеркнута значимость разработки отказоустойчивых алгоритмов маршрутизации, способных обеспечивать непрерывность работы системы в случае отказов отдельных компонентов или узлов. Это особенно важно для критических приложений, где непрерывность сервиса и снижение риска потери данных являются приоритетными задачами. 

ОПТИЧЕСКИЕ СИСТЕМЫ И ТЕХНОЛОГИИ

699
Введение. Представлены результаты экспериментального исследования возможности применения узкополосного полупроводникового лазерного диода с распределенной обратной связью в качестве источника и приемника оптического излучения для детектирования спектрального отклика волоконной решетки Брэгга. Метод. В качестве исследуемого полупроводникового лазерного диода выбран DFB-лазер LDI-1550-DFB-2.5G-20/70 компании Laserscom, серийно выпускаемый на российском рынке и обладающий типовыми характеристиками. Для перестройки центральной длины волны полупроводникового лазерного диода с распределенной обратной связью в диапазоне 1549,5–1552,0 нм использовалась прямая импульсная токовая модуляция с частотой 100 кГц, скважностью 40 и величиной тока 1 А в импульсе. Отраженное от волоконной решетки Брэгга оптическое излучение, соответствующее центральной длине волны Брэгга, регистрировалось за счет фотоэффекта в лазерном диоде. Проведена экспериментальная оценка оптоэлектронных параметров лазерного диода в фотовольтаическом режиме и режиме короткого замыкания: темновой ток, полоса пропускания и спектральная чувствительность. Оценка проводилась при температуре 25 °С. Основные результаты. Создана измерительная схема для детектирования отклика волоконной решетки Брэгга. Показано, что фотовольтаический режим лазерного диода применим для задач регистрации оптического излучения. Экспериментально получена амплитудночастотная характеристика лазерного диода в фотовольтаическом режиме в зависимости от напряжения прямого смещения. Результаты эксперимента: полоса пропускания по уровню –3 дБ составляет 300 МГц, максимальная чувствительность равна 0,1 А/Вт в режиме короткого замыкания, а амплитудный отклик линеен в диапазоне длин волн 1540–1560 нм. Для лазерного диода экспериментально получена вольтамперная характеристика при обратном смещении. Темновой ток при нулевом смещении лазерного диода составляет 12,5 пА. Обсуждение. Представленный метод регистрации отклика волоконной решетки Брэгга может быть использован для миниатюризации и упрощения оптических схем измерительных каналов устройств опроса волоконных решеток Брэгга. Полученные результаты могут быть полезны специалистам, занимающимся волоконно-оптическими датчиками и системами сбора и обработки сигналов с таких датчиков.
Исследование усилительных свойств активных областей на основе In0,60Ga0,40As/In0,53Al0,20Ga0,27As сверхрешеток, используемых для вертикально-излучающих лазеров
Копытов П. Е., Андрюшкин В. В., Пирогов Е. В., Соболев М. С., Бабичев А. В., Шерняков Ю. М., Максимов М. В., Лютецкий А. В., Пихтин Н. А., Карачинский Л. Я., Новиков И. И., Тиан С. ., Егоров А. Ю.
709
Введение. Исследованы активные области вертикально-излучающих лазеров спектрального диапазона 1300 нм на основе сверхрешеток In0,60Ga0,40As/In0,53Al0,20Ga0,27As. Проведено сопоставление пороговых характеристик лазеров с активными областями на основе сильно механически напряженных квантовых ям In0,74Al0,16Ga0,10As. Метод. Гетероструктура полосковых лазеров с In0,60Ga0,40As/In0,53Al0,20Ga0,27As сверхрешеткой получена методом молекулярно-пучковой эпитаксии. Меза-структура полосковых лазеров сформирована методом селективного жидкостного травления с последующим нанесением омических контактов. Формирование полосковых лазеров с различной длиной резонатора выполнено методом ручного скалывания зеркал. Измерение выходных характеристик лазеров проведено в импульсном режиме с использованием калиброванного германиевого фотодиода большой площади, а спектральных характеристик — с помощью спектрофотометра на основе монохроматора. Основные результаты. Достигнутые пороговые характеристики (модальное усиление 40 см–1, плотность тока прозрачности 650 A/см2, внутренние оптические потери 8 см–1) полосковых лазеров, на основе сверхрешеток In0,60Ga0,40As/In0,53Al0,20Ga0,27As с низкой степенью рассогласования кристаллической решетки слоев InGaAs сопоставимы с пороговыми характеристиками лазеров на основе активных областей с сильно механически-напряженными квантовыми ямами In0,74Al0,16Ga0,10As. Характеристические температуры T0 и T1 составили 60 К и 87 К для полосковых лазеров с длиной резонатора 1 мм. Повышение частоты малосигнальной модуляции вертикально-излучающих лазеров и их температурной стабильности связано с использованием сильно механически-напряженных In0,60Ga0,40As/In0,53Al0,20Ga0,27As сверхрешеток. Обсуждение. Предложенные активные области на основе InGaAs-InP сверхрешеток могут найти применение при разработке вертикальноизлучающих лазеров спектрального диапазона 1300 нм. Результаты работы могут быть реализованы при создании экспериментальных образцов и оптимизации модуляционных параметров вертикально-излучающих лазеров спектрального диапазона 1300 нм.
717
Введение. Одной из главных задач ювелирной промышленности является придание эстетичного и художественного вида изделию. Это может достигаться путем изменения его цвета. Перспективным способом окрашивания драгоценных металлов является одноэтапный лазерный метод формирования наноструктур с плазмонными свойствами. Однако сегодня остается нерешенной проблема недостаточного понимания механизма формирования цветных покрытий. Поверхностные структуры обычно рассматриваются как набор отдельных сферических наночастиц. Для полного понимания происходящих физико-химических процессов необходимо рассматривать наночастицы в совокупности как агломераты наночастиц на поверхности. Методы и материалы. Для исследования выбран плоскопараллельный образец серебра 999,9 ювелирной пробы. Обработка поверхности серебра проводилась с помощью лазерного комплекса на базе иттербиевого волоконного лазера (ООО «Лазерный Центр», Санкт-Петербург, Россия) с наносекундной длительностью импульсов методом построчного сканирования по одной и двум осям сфокусированным лазерным пучком диаметром d0 = 50 мкм. Для характеризации поверхности серебра до и после лазерного воздействия использованы оптическая и сканирующая электронная микроскопии. Основные результаты. Исследовано влияние энергии в импульсе и частоты следования импульсов на оптические свойства поверхности серебра. Продемонстрирован процесс генерирования лазерно-модифицированных поверхностных наноструктур, характер их изменения при переходе от сканирования по одной оси к построчному сканированию. Показано, что изменение рельефа поверхности наблюдается и вне непосредственной зоны обработки. Отмечено неравномерное распределение наноструктурных элементов по поверхности обрабатываемой области, что приводит к неравномерности наблюдаемого цвета поверхности на микроуровне. Обсуждение. На основании анализа полученных данных предложена гипотеза формирования наноструктур. При воздействии лазерного излучения на поверхности серебра изначально формируются отдельные наночастицы шарообразной формы. Далее при увеличении температуры концентрация наночастиц значительно возрастает, что приводит к их слиянию и образованию из агломерированных наночастиц некоторых кластеров неправильной формы. Полученные новые данные о процессе формирования поверхностных наноструктур позволяют расширить понимание происходящих процессов, а также показывают возможность применения метода прямого лазерного окрашивания серебра в ювелирной промышленности.
726
Введение. Одной из проблем, решаемых разработчиками беспилотных летательных аппаратов с автономным управлением, является задача определения летательным аппаратом своего точного местоположения над местностью без помощи глобальных спутниковых навигационных систем. Существующие для малогабаритных беспилотных аппаратов массогабаритные и энергетические ограничения приводят к необходимости использования в их вычислительных устройствах относительно простых алгоритмов. В работе рассмотрены методы навигации беспилотных летательных аппаратов с помощью средств компьютерного зрения, реализуемого бортовыми оптическими и вычислительными устройствами. Применяемое машинное зрение обеспечивает автономность малоразмерных летательных аппаратов при отсутствии или неустойчивом канале связи с центром управления и/или системой спутниковой навигации. Метод. Предлагаемый алгоритм решает задачу идентификации участка местности, наблюдаемого с беспилотного летательного аппарата, с изображением местности, заложенным в памяти системы управления. Местоположение аппарата определяется по минимальной (максимальной) величине невязки между наблюдаемым текущим изображением и изображением участка местности, находящимся в запоминающем устройстве. Решение задачи идентификации основано на концепции иммунокомпьютинга, использующего сингулярное разложение матрицы признаков идентифицируемых объектов. Такой подход позволяет обеспечить высокие показатели качества идентификации за счет разложения матрицы признаков на три простых преобразования для перехода в новое признаковое пространство, которое не идентифицируемо, но компоненты которого являются статистически значимыми. Основные результаты. Проведена оценка показателей качества разрабатываемого алгоритма в сравнении с известным методом идентификации изображений путем вычисления корреляционной функции между двумя массивами признаков. Осуществлена серия испытаний, в которых для единых исходных данных оценивались вероятность правильного определения местоположения и быстродействие алгоритмов. Показано, что при предварительной подготовке «эталонного» изображения, хранимого в запоминающем устройстве беспилотного летального аппарата, быстродействие разработанного метода на порядок превышает производительность метода, основанного на вычислении корреляционной функции сравниваемых изображений. Средняя абсолютная ошибка правильного определения местоположения при использовании предлагаемого метода находится в диапазоне от 0,109 до 0,153. Обсуждение. Предложенный алгоритм может найти применение у разработчиков систем навигации для малоразмерных беспилотных летательных аппаратов благодаря его низким требованиям к ресурсам при сохранении уровня точности, достаточного в контексте решения задач ориентирования на местности. Устройства, реализующие предложенный алгоритм ориентации, обладают лучшими энергетическими и массогабаритными характеристиками.
738
Введение. В работе представлена концепция точечного амплитудного датчика регистрации смещения геотекстиля — синтетической ткани, армирующей геотехнические сооружения, подобные дамбе. Применение систем непрерывного контроля состояния строительной конструкции, основанных на идее «умного» геотекстиля, может значительно повысить безопасность объекта, предупреждая о необходимости проведения внеплановых ремонтных работ, возникновении аварийной ситуации и необходимости срочного прекращения эксплуатации объекта, эвакуации персонала или населения. Оценены возможности существующих технических решений датчиков смещения. Известно, что существующие системы мониторинга, использующие датчики на волоконных брэгговских решетках, не применимы в случае с геотекстилем. Это обусловлено большой податливостью грунта и практическим отсутствием в грунте упругой деформации. Кроме того, датчики на волоконных брэгговских решетках значительно дороже в производстве по сравнению с телекоммуникационным оптическим волокном. Метод. Одномодовое волокно в чувствительном элементе образует одну или несколько петель, зажатых между подвижными упорами, прикрепленными к корпусу и к подвижному активатору. При макроизгибе армирующего оптоволокна происходит нарушении полного внутреннего отражения, что приводит к амплитудной модуляции излучения. Макроизгиб пропорционален смещению активатора, прикрепленного к геотекстилю. В работе приведены конструкция, размеры чувствительного элемента и математические соотношения размеров и характеристик элементов конструкции для обработки сигнала. Модель датчика реализована из ABS-пластика и оптоволокна Corning SMF-28. Основные результаты. Экспериментальная установка для проверки предложенной концепции реализует контролируемое смещение активатора, ввод и вывод излучения. Определены зависимости выходной мощности от диаметра изгиба оптоволокна в интервале от 25 до 11 мм и смещения в пределах до 14 мм при длине волны излучения 1550 нм. Показано, что полученные зависимости монотонны, на них имеются квазилинейные участки. Полученные на графиках перегибы при малом диаметре изгиба оптоволокна возникают в результате интенсивного выхода излучения из сердцевины в оболочку и рассеяния в ней, а при большом диаметре — из-за малых изгибных потерь. Обсуждение. Проведенные исследования показали, что предложенный датчик позволяет надежно фиксировать смещение до 0,5 мм. Результаты обладают хорошей повторяемостью. Отметим, что датчик уступает по точности регистрации смещений грунта, но по стоимости на порядок дешевле датчиков на волоконных брэгговских решетках.

АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ И РОБОТОТЕХНИКА

745
Введение. Предложен новый алгоритм управления нелинейными объектами с гарантией нахождения регулируемой переменной в заданном множестве в условиях параметрической неопределенности, внешних возмущений и высокочастотных помех в измерениях. Метод. Задача решена в два этапа. На первом этапе применен линейный фильтр нижних частот для устранения высокочастотных составляющих в измеряемом сигнале. На втором этапе использовано преобразование координат, чтобы свести исходную задачу с ограничениями к задаче исследования на устойчивость по вход-состоянию новой системы без ограничений. Основные результаты. Разработан алгоритм обратной связи по выходу для нелинейных систем в условиях параметрической неопределенности, внешних возмущений и высокочастотных помех в измерениях. Выполнено моделирование в MATLAB/Simulink, результаты которого показали эффективность предложенного алгоритма. Обсуждение. Представленный алгоритм может эффективно решать задачи управления электроэнергетическими сетями и рядом других электромеханических систем при наличии помех в измерениях.

НОВЫЕ МАТЕРИАЛЫ И НАНОТЕХНОЛОГИИ

751
Введение. Полимерные щетки, как модифицирующие покрытия, значительно улучшают трибологические свойства различных контактирующих поверхностей. Трение, которое возникает при наложении внешней нагрузки и латеральном сдвиге полимерных щеток друг относительно друга, определяется их энергией взаимодействия и глубиной взаимопроникновения. Если щетки погружены в низкомолекулярный растворитель, силу трения можно регулировать, варьируя качество растворителя за счет изменения внешних условий: температуры, химического состава раствора и т. п. Отметим, что теоретические исследования, посвященные влиянию качества растворителя на трибологические свойства щеток, практически отсутствуют. Метод. Для определения влияния качества растворителя на взаимодействие плоских полимерных щеток использовались два взаимодополняющих подхода: аналитический и численный методы самосогласованного поля. В обоих случаях применялась крупнозернистая модель полимерных щеток. Качество растворителя в модели задавалось через параметр Флори–Хаггинса взаимодействия полимер-растворитель. Основные результаты. Проведена количественная оценка ширины зоны перекрывания, распирающего давления и силы трения, возникающей при сближении щеток друг с другом. Предложено теоретическое описание силы трения в режиме малых скоростей сдвига на основе уравнения Бринкмана для двух сжатых щеток, скользящих друг против друга. Обсуждение. Показано, что при постоянстве общей степени полимеризации, плотности прививки и скорости латерального сдвига щеток относительно друг друга ширина зоны перекрывания одинаково убывает с увеличением межплоскостного расстояния по степенному закону независимо от качества растворителя. В условиях сильного сжатия плоских полимерных щеток сила трения стремится к определенному предельному значению, в то время как коэффициент трения стремится к нулю в независимости от качества растворителя. В области умеренного давления коэффициент трения существенно возрастает с уменьшением растворимости привитых полимеров при одинаковых приложенной внешней нагрузке и составе плоских полимерных щеток. Аналитический метод показал высокую согласованность с данными проведенного численного моделирования. Полученные результаты позволяют прогнозировать трибологические свойства полимерных щеток в зависимости от качества растворителя и, как следствие, предсказывать влияние внешних условий на силу трения между модифицированными поверхностями.

КОМПЬЮТЕРНЫЕ СИСТЕМЫ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

758
Введение. Задача распознавания метаинформации заключается в выявлении и извлечении данных различной природы (речь, шумы, акустическая сцена, акустические события, аномальные звуки) из входного аудиосигнала. Существуют подходы, способные обеспечить высокую точность распознавания метаинформации различной природы в аудиозаписях. Данные модели часто опираются на глубокие нейронные сети с числом обучаемых параметров более сотни миллионов. Как следствие, такие модели невозможно использовать в реальных коммерческих системах, так как они ограничены в вычислительных ресурсах. Это влияет на работу умных устройств, таких как мобильные телефоны, умные часы, колонки, системы «умный дом». Обычно к умным устройствам предъявляются серьезные требования по энергоэффективности, что влияет на применение тех или иных компонентов в составе таких продуктов. Тактовые частоты процессоров, объемы оперативной и дисковой памяти в таких устройствах сильно ограничены и не способны работать с нейросетевыми моделями с большим числом обучаемых параметров. Подобные ограничения требуют поиска возможных решений, которые бы позволили применять технологии распознавания метаинформации в коммерческих устройствах. Возможным решением могут стать так называемые компактные нейросетевые модели, которые за счет архитектуры и многозадачных алгоритмов обучения способны распознавать метаинформацию в аудиозаписях и используют ограниченное число обучаемых параметров. Коммерческий интерес к данной задаче согласуется и с заинтересованностью научного сообщества. Так, в рамках международного конкурса под названием «Detection and Classification of Acoustic Scenes and Events» организаторами были сформулированы специальные подзадачи — распознавание акустической сцены при использовании низкоресурсных систем («LowComplexity Acoustic Scene Classification») и детекции аудиособытий («Sound Event Detection with Weak Labels and Synthetic Soundscapes»). Важными исследовательскими вопросами являются как создание оптимальной архитектуры компактной нейронной сети, так и алгоритмов их обучения для получения низкоресурсной высокоточной системы распознавания акустических сцен и аудиособытий. Метод. Исследование выполнено на основе корпуса данных задач Challenge «Low-Complexity Acoustic Scene Classification» и «Sound Event Detection with Weak Labels and Synthetic Soundscapes». Предложена архитектура многозадачной нейронной сети, состоящая из общего кодировщика и двух независимых декодировщиков для каждой из двух задач. Рассмотрены классические алгоритмы многозадачного обучения SoftMTL и HardMTL, а также разработаны их модификации CrossMTL, которые опираются на идею переиспользования данных от одной задачи при обучении декодировщика решать вторую задачу, и FreezeMTL, в процессе которого обученные веса общего кодировшика замораживаются после обучения на первой задаче и используются для оптимизации второго декодировщика. Основные результаты. Показано, что применение модификации CrossMTL дает возможность существенно увеличить точность классификации акустических сцен и детекции аудиособытий по сравнению с классическими подходами SoftMTL и HardMTL. Алгоритм FreezeMTL позволяет получить модель, демонстрирующую точность классификации сцен в 42,44 % и детекции событий в 45,86 %, что сравнимо с показателями базовых решений задач 2023 года. Обсуждение. Предложена компактная нейронная сеть, состоящая из 633,5 тыс. обучаемых параметров, требующая 43,2 млн арифметических операций для обработки аудио длиной в одну секунду. Модель использует на 7,8 % меньше обучаемых параметров и на 40 % меньше арифметических операций по сравнению с наивным применением двух независимых моделей. Разработанную модель можно применить в умных устройствах за счет уменьшения числа обучаемых параметров и арифметических операций, необходимых для ее применения.
770
Введение. По мере усложнения нейронных сетей увеличивается количество параметров и необходимых вычислений, что затрудняет установку и эксплуатацию систем искусственного интеллекта на периферийных устройствах. Структурная дистилляция может существенно сократить ресурсоемкость применения любых нейронных сетей. Метод. В работе представлен метод оптимизации нейронных сетей, который сочетает в себе преимущества структурной дистилляции и генетического алгоритма. В отличие от эволюционных подходов, используемых при поиске оптимальной архитектуры или дистилляции нейронных сетей, при формировании вариантов дистилляции предлагается кодировать не только параметры нейронной сети, но и связи между нейронами. Основные результаты. Экспериментальное исследование проводилось на моделях VGG16 и ResNet18 с использованием набора данных CIFAR-10. Показано, что структурная дистилляция позволяет оптимизировать размер нейронных сетей, сохраняя их обобщающую способность, а генетический алгоритм используется для эффективного поиска оптимальных вариантов дистилляции нейронных сетей, учитывая их структурную сложность и производительность. Обсуждение. Полученные результаты продемонстрировали эффективность предложенного метода при уменьшении размеров и улучшении производительности сетей с допустимой потерей качества.
779
Введение. Основной проблемой при построении интеллектуальных систем является недостаточность данных для машинного обучения, что особенно актуально для распознавания языка жестов для глухих и слабослышащих людей. Одним из способов увеличения объема данных для обучения интеллектуальных систем является их синтез. В отличие от синтеза речи, создавать последовательность жестов на вьетнамском и некоторых других языках, в точности повторяющих текст, невозможно. Это связано с существенной ограниченностью словаря жестов и отличающимся порядком слов в предложениях. Целью работы является обогащение обучающего набора видеоданных для создания систем распознавания вьетнамского языка жестов (Vietnamese Sign Language, ViSL). Метод. Поскольку транслировать слова исходного текста в жесты невозможно, возникает задача перевода с обычного языка на жестовый. Для решения поставленной задачи в работе использован двухфазный процесс. На первой фазе выполняется предварительная обработка текста со стандартизацией текстового формата, сегментацией слов и предложений, а затем кодирование слов с помощью словаря языка жестов. На данном этапе не требуется удалять знаки препинания и стоп-слова, поскольку они связаны с точностью N-граммовой модели. На второй фазе вместо использования синтаксического анализа применяется статистический метод формирования последовательности жестов. При этом за основу берется марковская модель на графе переходов между словами, в которой вероятность следующего слова зависит только от двух предыдущих слов. Вероятности переходов вычисляются на существующем размеченном наборе ViSL. Метод графового поиска в ширину используется для составления списка всех предложений, сгенерированных на основе заданного грамматического правила и матрицы семантического взаимодействия между словами. Обратное значение логарифма произведения вероятности совместного появления последовательных словосочетаний из трех слов в предложении используется для оценки частоты встречаемости этого предложения в заданном наборе данных. Основные результаты. Основываясь на данных ViSL, состоящих из 3234 слов, рассчитаны матрицы вероятности, представляющие отношения между словами, на основе данных ViSL с 50 млн предложений, собранных из вьетнамских газет и журналов. Для различных грамматических правил выполнено сравнение количества сгенерированных предложений и оценка точности 50 наиболее часто встречающихся предложений. Средняя точность составила 88 %. Точность сгенерированных предложений оценена статистическими методами. Показано, что число сгенерированных предложений зависит от количества частей слова, которые помечены в соответствии с правилами грамматики. Семантическая точность сгенерированных предложений высока, если поисковые слова помечены правильными частями речи. Обсуждение. По сравнению с методами машинного обучения, предлагаемая модель дает хорошие результаты для языков без словоизменений и порядка слов, следующих определенным правилам, таких как вьетнамский язык, и не требует больших вычислительных ресурсов. Недостатком модели является зависимость точности от типа слова, предложения и сегментации слов. Взаимосвязь слов зависит от наблюдаемого набора данных. Будущее направление исследований — создание абзацев на языке жестов. Полученные данные могут быть использованы в моделях машинного обучения для задач обработки языка жестов.
788
Обнаружение и устранение аномального поведения сетевых систем являются важнейшими мерами по обеспечению безопасности уязвимых инфраструктур в динамичном контексте кибербезопасности. Предложена архитектура модели машинного обучения ensemble, которая использует преимущества моделей XGBoost, Gradient Boosting, случайного леса и метода опорных векторов для выявления аномалий в наборе данных. Представленный подход использует совокупность перечисленных моделей с взвешенным голосованием и основан на точности, для улучшения обнаружения аномалий и обеспечения надежной и адаптивной сетевой безопасности в реальном времени. Модель коллективного обучения оценивается по стандартным показателям и демонстрирует исключительную эффективность, достигая высокой точности 99,68 % в наборе данных NSL KDD. Высокая производительность подхода расширяет возможности модели в выявлении аномалий в сетевом трафике, демонстрирует ее потенциал в качестве надежного инструмента для усиления мер кибербезопасности против развивающихся угроз.
797
Система разграничения доступа на основе атрибутов (Attribute-Based Access Control, ABAC) — одна из наиболее эффективных и широко используемых систем контроля доступа, обеспечивающая масштабируемость. Когда пользователи хотят получить доступ к информационному ресурсу, им необходимо предоставить свои атрибуты для процесса верификации, что может, в свою очередь, раскрыть их личные данные. Во многих исследовательских работах предлагается контроль доступа, основанный на атрибутах, использующий блокчейн, что обеспечивает защищенную от искажений (Zero-Knowledge, ZK) и прозрачную систему контроля доступа. Однако конфиденциальность системы может быть нарушена в зависимости от характера атрибутов. В работе предлагается использовать систему контроля доступа на основе Ethereum и доказательств без разглашения (ZK-ABAC). Система упрощает управление доступом к устройствам/объектам, обеспечивает эффективную и защищенную от искажений платформу, контролирующую все действия и управление доступом. При этом сохраняется конфиденциальность атрибутов. Предлагаемая модель контроля доступа на основе технологии ZK-ABAC использует смарт-контракты для управления доступом. Протокол ZK-SNARK обеспечивает конфиденциальность атрибутов пользователей. Система InterPlanetary File System применяется для создания распределенной системы хранения данных, а Chainlink для управления связью и данными между внутренними/ внешними блокчейн-системами. Для оценки работоспособности предложенной модели проведены эксперименты и тесты, включая использование ZK-SNARK с блокчейн-технологией Ethereum. Результаты экспериментов продемонстрировали проблемы масштабируемости на этапах настройки и проверки, а также повышение эффективности на этапе верификации при масштабировании для большего числа пользователей. Полученные результаты подтвердили практическую эффективность предложенной модели ZK-ABAC для безопасного управления доступом с сохранением конфиденциальности в децентрализованных средах.
Сравнительный анализ нейросетевых моделей для картографирования лесных рубок по летним космическим снимкам
Мельников А. В., Полищук Ю. М., Русанов М. А., Аббазов В. Р., Кочергин Г. А., Куприянов М. А., Байсалямова О. А., Соколков О. И.
806
Введение. Исследована задача повышения оперативности обнаружения и картографирования лесных рубок по космическим снимкам с целью выявления нарушений экологического законодательства. Традиционные методы дешифрирования данных дистанционного зондирования Земли требуют больших трудозатрат и высокой квалификации исполнителей. Для автоматизации процессов дешифрирования космических снимков разработано большое количество разнообразных методов, в том числе основанных на применении современных технологий глубокого машинного обучения. В работе проведен сравнительный анализ сверточных и трансформерных моделей нейронных сетей, перспективных для решения задач сегментации лесных рубок по летним космическим снимкам со спутника Sentinel-2. Метод. В проведенном исследовании для сегментации лесных рубок применялись сверточные модели U-Net++, MA-Net, 3D U-Net, FPN-ConvLSTM и трансформерные модели SegFormer, Swin-UperNet. Особенностью компьютерного эксперимента является адаптация различных моделей нейронных сетей для анализа пары разновременных многоканальных спутниковых изображений. Представлено описание исходных данных, процедура их предобработки с учетом специфики и методика формирования обучающей выборки на основе имеющегося архива космических снимков. Предложены процедуры обучения и оценки точности рассматриваемых нейросетевых моделей с использованием метрики F1. Для оценки точности выполнено сравнение результатов моделирования с традиционным методом визуального дешифрирования с применением средств геоинформационных систем. Основные результаты. Получены результаты компьютерного эксперимента на примере территории Ханты-Мансийского автономного округа. Сравнение моделей сегментации лесных рубок по летним космическим снимкам показало, что точность F1 для разных моделей находится в пределах от 0,409 до 0,767. Наибольшую точность показала трансформерная модель SegFormer, которая позволила обнаруживать лесные рубки, неучтенные человеком. Время обработки одной пары полноразмерных космических снимков площади размером 100 × 100 км2 составило 15 мин, что в 16 раз меньше времени, требуемого специалисту для выполнения той же задачи традиционным способом. Такая скорость обработки снимков является важным показателем для мониторинга обширных лесохозяйственных территорий. Обсуждение. Предлагаемый метод сегментации лесных рубок, основанный на трансформерной нейронной сети SegFormer, может быть использован для решения задачи оперативного выявления и картографирования незаконных лесных рубок. Для повышения качества работы модели необходима балансировка обучающей выборки с целью выравнивания количества снимков с полигонами рубок различной формы и размера, а также включение в выборку снимков с частичной облачностью и тенями от облаков.
815
Введение. Активное развитие цифровых технологий, технологии интернета вещей, виртуальных испытаний требуют увеличения объемов собираемой и используемой информации, которая размещается в системах хранения данных (СХД). Стремительный рост объема данных ведет к ужесточению требований к СХД, например, основного их них — повышение надежности хранения больших объемов информации. Данное требование предполагает необходимость оценки надежности оборудования СХД. Для этих целей требуется оценка таких показателей надежности как вероятность безотказной работы, вероятность отказов, средний остаточный ресурс, гамма-процентный ресурс. Традиционно показатели надежности оцениваются при экспоненциальном распределении времени отказа. В реальной ситуации выборки времени отказов оборудования СХД являются малыми, по которым невозможно однозначно идентифицировать исходное распределение. В работе предложена модель оценки показателей надежности как гамма-процентный остаточный ресурс в условиях неполных данных, представленных малыми выборками случайных величин времени безотказной работы оборудования. Научная новизна работы состоит в получении общего решения задачи определения гарантированного гамма-процентного остаточного ресурса оборудования в условиях неполных данных, представленной малыми выборками наработок до отказа оборудования. Метод. Математическая формализация задачи оценки гамма-процентного остаточного ресурса оборудования СХД в условиях неполных данных, представленных малыми выборками, выполнена в виде модели стохастического уравнения. Решением уравнения является гарантированная (нижняя, верхняя) оценка гамма-процентного остаточного ресурса оборудования. Основные результаты. Предложена модель оценки гамма-процентного остаточного ресурса оборудования СХД в условиях неполных данных. Решена в общем случае задача нахождения гарантированных (нижних и верхних) оценок гамма-процентного остаточного ресурса оборудования на множестве функций распределения времени безотказной работы оборудования с заданными моментами, равными выборочным моментам, определяемым по малым выборкам. При двух моментах времени безотказной работы оборудования получены аналитические соотношения для определения гамма-процентного остаточного ресурса. Работоспособность модели продемонстрирована на примере определения нижней гарантированной оценки гамма-процентного остаточного ресурса модели дискового массива HP EVA P6500. Обсуждение. Полученные результаты могут быть использованы специалистами при оценке и оптимизации гамма-процентного остаточного ресурса оборудования СХД.
824
Рассеянный склероз (РС) представляет собой прогрессирующее аутоиммунное заболевание, поражающее центральную нервную систему. Раннее и точное обнаружение поражений РС на снимках магнитно-резонансной томографии (МРТ) головного мозга имеет решающее значение для эффективного лечения. В работе предлагается классификация на основе глубокого обучения для автоматического обнаружения и диагностики поражений РС на снимках МРТ, использующий сверточные нейронные сети (Convolutional Neural Network, CNNs) для точной идентификации и классификации поражений. Классификация включает в себя всесторонний анализ наборов данных МРТ и этапы их предварительной обработки, такие как нормализация и сегментация поражений. Предложенная архитектура CNN, разработанная для обнаружения поражений РС, достигает точности 98,2 % на тестовом наборе данных. Благодаря внедрению передовых методов распознавания изображений, представленный метод глубокого обучения классифицирует поражения РС среди различных патологий мозга, присутствующих на снимках МРТ. Метод выделяет поражения РС на снимках МРТ, помогая нейрорадиологам в точной диагностике и планировании лечения. Исследование вносит вклад в улучшение диагностики РС, предоставляя надежный и автоматизированный инструмент обнаружения и классификации поражений.
834
Введение. Развитие цифровых систем коммуникации сопряжено с растущим количеством проявлений деструктивного поведения людей и необходимостью оперативного на него реагирования. Ввиду слабой формализации предметной области агрессии, наиболее перспективными методами распознавания деструктивного поведения являются методы, основанные на подходах машинного обучения, которые для эффективной работы требуют репрезентативных выборок релевантных данных. При создании корпусов поведенческих данных необходимо решить следующие проблемы: соответствие разметки данных корпуса реальному поведению; представленности поведения в однотипных ситуациях и в корпусе натурального поведения. Целью работы является разработка методики создания выборки многомодальных данных поведенческой агрессии человека, содержательно отражающей агрессию как явление и обеспечивающей релевантность данных. Метод. В работе описывается разработанная методика создания выборок многомодальных данных, содержащих спонтанное агрессивное поведение. В ходе содержательного анализа предметной области агрессивного поведения человека выделяются значимые атрибуты агрессии такие как явления (наличие субъекта и объекта агрессии, деструктивный характер агрессивного действия) и единицы анализа поведения (временные сегменты аудио и видео, на которых локализованы информанты); определяются типы регистрируемой агрессии (физическая и вербальная явные прямые); обосновываются критерии оценки агрессивного поведения каждого типа посредством введения перечня действий, однозначно определяющих каждый вид агрессии. Методика состоит из следующих этапов: сбор видео в открытом доступе в сети Интернет; выделение временных интервалов, на которых проявляется агрессия; локализация информантов на кадрах видео; транскрибирование реплик информантов; оценка актов физической и вербальной агрессии группой аннотаторов посредством разработанного алгоритма оценки поведения; вычисление согласованности оценок с помощью коэффициента Флейсса. Основные результаты. Для апробации методики создан и размечен группой аннотаторов аудиовизуальный корпус данных спонтанного агрессивного поведения русскоязычных информантов Audiovisual Aggressive Behavior in Online Streams (AVABOS). Корпус данных содержит видео- и аудиосегменты, на которых присутствует вербальная и физическая агрессии соответственно, проявляемые русскоязычными информантами в ходе онлайн-видеотрансляций. Обсуждение. Результаты согласованности разметки показали высокий уровень для физической агрессии (κ = 0,74) и средний уровень для вербальной (κ = 0,48), что подтверждает обоснованность разработанной методики. Корпус данных AVABOS может использоваться для решения задач автоматического распознавания агрессии человека. Помимо создания корпусов агрессивного поведения, методика также может использоваться для создания корпусов, содержащих другое поведение.
843
Интеллектуальные системы требуют взаимодействия с различными сложными окружающими средами. Например, роботу может потребоваться взаимодействовать в обстановке со сложными геометрическими структурами. Для правильного определения объектов, перемещающихся в пространстве, требуется точное геометрическое обоснование. 3D-реконструкция — сложная задача, требующая большого количества изображений. В работе предлагается создание интеллектуальных систем для 3D-реконструкции из отдельных 2D-изображений. Разработан обучаемый контекст реконструкции, который для реализации синтеза использует определенные признаки. Используемые методы осуществляют кодирование признаков метки входных данных для классификации, извлекая эту информацию для принятия более обоснованных решений. Бинарная сверточная нейронная сеть (Binary Classifier Neural Network, BCNN) классифицирует, находится ли точка внутри или снаружи объекта. Система реконструкции моделирует 3D-структуру объекта и изучает параметры фильтра признаков. Геометрия и соответствующие признаки обновляются на основе функции потерь. Обучение модели не требует сжатого наблюдения для визуализации задачи реконструированных форм и переноса текстуры. Поток сети с множеством точек приводит к тому, что BCNN занимает сравнительно малый объем памяти и не ограничивается определенными классами, для которых доступны шаблоны. Исследование точности метрики показали, что модель может расширить кодировщик занятости с помощью генеративной модели, которая не запрашивает условие получения изображения и может быть обучена безусловно. Таким образом, за время, необходимое для обучения модели, создается большее количество нейронов и весовых переобученных параметров.
849
Анализ вредоносного программного обеспечения включает исследование функциональности, поведения и потенциальных рисков. Искусственный интеллект и глубокое обучение открывают возможности автоматизированного, интеллектуального и адаптивного анализа вредоносного программного обеспечения. В работе предлагается модель глубокой нейронной сети (Deep Neural Network, DNN), созданная на основе признаков, выбранных с помощью F-теста дисперсионного анализа (ANalysis Of VAriance, ANOVA), для повышения точности распознавания путем выявления информативных признаков. DNN-ANOVA представляет собой метод выбора признаков, используемый для анализа числовых входных данных, когда целевая переменная является категориальной. К наиболее релевантным признакам относятся те, значения оценки которых превышают определенный порог, равный отношению суммы оценок всех признаков к общему числу признаков. Эксперименты выполнены на наборе данных CIC-MalMem-2022. Проведен анализ обнаружения или отсутствия вредоносного программного обеспечения с использованием бинарной классификации, а также полиномиальной классификации для определения его типа. Согласно результатам F-теста, модель DNN-ANOVA достигает наилучших значений: 100 % — precision, 99,99 % — accuracy, 99, 99 % — F1-score и 99,98 % — recall для бинарной классификации. Кроме того, DNN-ANOVA превосходит текущие работы с общим показателем точности (accuracy) 85,83 % для групповых атак и 73,98 % для индивидуальных атак в случае полиномиальной классификации.

МАТЕМАТИЧЕСКОЕ И КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

Карта намагничивания вентильно-индукторного электродвигателя: экспериментальный подход
Яременко А. М., Демидова Г. Л., Сорокина А. А., Маматов А. Г., Богданов А. Н., Анучин А. С.
858
Введение. В настоящее время вентильно-индукторная электрическая машина рассматривается как наиболее перспективный вид электромеханического преобразователя энергии без постоянных магнитов для работы со скоростями ниже номинальных значений. Для управления вентильно-индукторным электродвигателем с минимальными пульсациями момента необходимо формировать токи фаз в соответствии с угловым положением ротора в функции потокосцепления фазы от тока и положения ротора. Карты намагничивания также используются в системах управления с косвенным определением положения ротора. Метод. В работе представлена экспериментальная методика получения карты намагничивания вентильно-индукторного электродвигателя. Приведен расчет потокосцепления для каждого угла положения ротора электрической машины. Предложенное решение предусматривает механическую блокировку ротора вентильно-индукторного двигателя и периодическую подачу напряжения при помощи полупроводникового преобразователя на одну из фаз электродвигателя для получения информации о фазном токе и напряжении. Основные результаты. С использованием представленного экспериментального подхода получены соотношения между потокосцеплением, током фазы и углом поворота ротора. Показано, что данное решение может быть использовано для точного определения карты намагничивания вентильно-индукторного двигателя. Обсуждение. Представленную методику целесообразно использовать при проектировании системы управления с прогнозированием.

КРАТКИЕ СООБЩЕНИЯ

866
Представлены результаты исследования спектральной зависимости квантовой эффективности фотокаталитического разложения воды. Определена связь спектра излучения с эффективностью фотокаталитического разложения воды на водород и кислород. С этой целью исследован электролит на основе нитрата натрия. Фотокатод содержал нанопористые слои серебра. Показано, что максимальная квантовая эффективность фотокаталитического разложения воды по спектру интегрально составляет 1,9 %, а с уменьшением длины волны излучения повышается. Полученные результаты могут быть использованы при разработке устройств солнечной энергетики, предназначенных для фотокаталитического разложения воды на водород и кислород.
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика