Меню
Публикации
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор
НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
Аннотации номера
ОПТИЧЕСКИЕ СИСТЕМЫ И ТЕХНОЛОГИИ
871
Введение. При корпусировании фотонных интегральных схем и реализации технологии гибридной интеграции важной проблемой является обеспечение вывода оптического излучения из источника в оптоволоконный кабель. Потери при выводе оптического излучения обусловлены рассогласованием модового пятна излучения в оптоволокне и в волноводе, а также присутствующими при сборке отклонениями оптических элементов от оптимального установочного положения. В работе приведены результаты проектирования, изготовления и исследования волоконной сферической микролинзы, позволяющие решить проблему согласованного вывода оптического излучения из радиофотонных компонент в оптоволокно. Метод. Предложенная схема вывода оптического излучения из полупроводникового лазерного диода включает дискретную сферическую микролинзу и волоконную коллимирующую сферическую микролинзу. Волоконная сферическая микролинза диаметром 250 мкм сформирована методом дугового оплавления сегмента оптоволокна FG125LA, приваренного к оптоволокну SMF-28 и образующего на нем бессердцевинную вставку. Для определения оптимальных геометрических параметров микролинзы с целью обеспечения коллимированного пучка предложена модель с бессердцевинными вставками разной длины. Моделирование выполнено с использованием программного пакета Comsol Multiphysics. Тип пучка оптического излучения на выходе сформированной волоконной сферической микролинзы проверялся экспериментально. Основные результаты. Определена оптимальная конструкция коллимирующей волоконной сферической микролинзы. Экспериментальный образец коллимирующей волоконной сферической микролинзы позволил реализовать оптическую схему вывода оптического излучения и исследовать ее эффективность. Обсуждение. Показано, что реализованная оптическая схема позволяет увеличить эффективность передачи оптической мощности от источника к оптоволокну в два раза по сравнению со стыковым соединением. Разработанная схема вывода оптического излучения обеспечивает диапазон допустимого отклонения ее элементов от оптимального положения не менее чем на 12,8 мкм, что в два раза превышает диапазон допустимого отклонения элементов для стыкового соединения источника излучения с оптоволокном. Представленную схему вывода оптического излучения рекомендуется использовать с интегральным расширителем пучка для увеличения эффективности передачи оптической мощности.
880
Введение. Представлены результаты исследований ископаемых смол различного геологического возраста и географического происхождения. Предложен новый метод спектрального анализа для дифференциации ископаемых смол по возрасту от триасового периода до современности, позволяющий спектрально отличить ископаемые смолы друг от друга. Впервые получены спектры комбинационного рассеяния света для ископаемой смолы позднего триасового периода. Показана возможность применения метода для дифференциации смол от позднего триасового периода до современности. Метод. Исследования выполнены методом спектроскопии комбинационного рассеяния света. Спектры получены с использованием спектрометра Renishaw Virsa (Великобритания) для длины волны 785 нм и портативного спектрометра комбинационного рассеяния света Raport 1064 (Россия) для 1064 нм. Диапазон исследованных спектров 400–3200 см–1. Изучено 27 образцов ископаемых смол Евразии, Африки, Америки, Австралии. Основные результаты. По результатам исследований образцов ископаемых смол различного географического местоположения и возраста установлены различия в величинах отношения колебательных мод валентного скелетного колебания (ν(С=С)) и деформационного колебания группы СH2 (σ(СH2)) в диапазонах волновых чисел 1650–1600 см–1 и 1440–1460 см–1 соответственно у ископаемых смол в возрасте от триасового периода до современности. Установлено, что с увеличением возраста смолы, степень их полимеризации уменьшается. Для смолы возраста триасового периода показано отсутствие сигналов ν(СH2, СH3) в высокочастотной области для лабданового каркаса, что свидетельствует о крайне низкой степени полимеризации структуры. Обсуждение. Полученные результаты потенциально позволяют применять метод комбинационного рассеяния света для дополнительной дифференциации возраста ископаемых смол, в случае ограничения применения метода радиоуглеродного анализа по возрасту (40 000 лет). Преимуществом предложенного метода является возможность быстрого, с минимальной пробоподготовкой определения возраста ископаемой смолы возрастов триасового и раннего мелового периодов и современности. Вместе с точностью дифференциация возрастов ископаемых смол в диапазоне возрастов от позднего мелового периода до олигоценмиоцен пока остается низкой, что требует дополнительных исследований. Также на данном этапе развития метод не учитывает влияние условия окружающей среды: климата, растительности, условий фоссилизации, при которых происходили превращения живицы в смолу.
892
Введение. Представлены результаты оптимизации геометрии двумерного фотоннокристаллического волновода с целью минимизации оптических потерь и стабилизации волноводных мод. Без учета поглощения основным фактором, приводящим к уменьшению пропускания фотоннокристаллического волновода, является возникновение брэгговского отражения. Брэгговское отражение может быть снижено путем уменьшения областей перекрытия участков фотонного кристалла с высоким показателем преломления и волноводом на границе фотонный кристалл–волновод. Для этого отверстия в фотонном кристалле на границе с волноводом могут быть изготовлены не целыми, а в виде половин отверстий. Для стабилизации волноводных мод выполнено изменение ширины волновода. Метод. Оптимизация проводилась путем численного моделирования с использованием метода конечных разностей во временной области в среде Comsol Multiphisics 5.5. Энергетическая зонная структура фотонного кристалла, окружающего волновод, вычислялась методом блоховских функций. При моделировании применена свободная треугольная сетка с качеством «extremely fine». Проведено исследование в области длин при частоте собственных значений равной 190–200 ТГц. Для решения поставленных задач использовались процедуры ARPACK FORTRAN, которые работают на основе итерации Арнольди. Основные результаты. Показано, что изменение геометрии фотоннокристаллического волновода на границе фотонный кристалл–волновод позволяет уменьшить модуляцию эффективного показателя преломления и за счет этого снизить брэгговское отражение от волновода. Расчеты показали, что примененная геометрическая оптимизация фотоннокристаллического волновода позволяет уменьшить брэгговское отражение в 1,75 раз. Установлено, что потери фотоннокристаллического волновода, в данном случае, не превышают 0,4 дБ/см. Показано, что уменьшение диаметра отверстий в фотонном кристалле при постоянном периоде фотоннокристаллической решетки приводит к уменьшению ширины фотонной запрещенной зоны. Установлено, что в волноводе оптимальной ширины модуляция волноводной моды сохраняется, но ее амплитуда значительно уменьшается. Обсуждение. Полученные результаты могут быть использованы при разработке интегрально-оптических устройств для телекоммуникаций и сенсорики с малыми оптическими потерями.
899
Введение. Представлены результаты исследования и разработки способов подавления аддитивных шумов в волоконно-оптических интерферометрических датчиках, оптическая схема которых основана на двулучевом интерферометре Майкельсона. Предложенные решения предназначены для уменьшения уровня аддитивных шумов и увеличения соотношения сигнал-шум в фазовом сигнале волоконно-оптического интерферометрического датчика. Первый предложенный способ предполагает введение в оптическую схему дополнительного фотоприемника, что позволяет осуществить одновременную регистрацию одного и того же интерференционного сигнала дважды. В оптическую схему второго предложенного способа включается дополнительная волоконная линия задержки, которая позволяет опрашивать один и тот же датчик два раза. Метод. Для подавления аддитивных шумов применены методы математического анализа, основанные на когерентном усреднении сигналов. Когерентное усреднение сигналов позволяет без искажения полезной составляющей фазового сигнала уменьшить уровень аддитивных шумов на величину, пропорциональную квадратному корню из количества сигналов, участвующих в усреднении. Основные результаты. Экспериментальное исследование предложенных способов подавления аддитивных шумов показало уменьшение уровня шумов в 1,4 раза и увеличение соотношения сигнал-шум в фазовом сигнале волоконно-оптического интерферометрического датчика в среднем на 2,87 дБ в полосе частот от 250 до 2250 Гц. Обсуждение. Предложенные способы подавления аддитивных шумов могут быть использованы для увеличения соотношения сигнал-шум в волоконно-оптических измерительных системах, построенных на основе массивов интерферометрических датчиков, таких как волоконно-оптические буксируемые и донные сейсмические косы, системы охраны периметра, волоконнооптические навигационные системы и комплексы.
907
Введение. Предложена методика компенсации постоянной шумовой составляющей рефлектограмм для когерентного оптического рефлектометра обратного рассеяния во временной области. Представленное решение обеспечивает корректную визуализацию рефлектограмм, улучшает их читаемость и позволяет осуществлять регистрацию слабых отраженных сигналов с волоконной линии связи. Экспериментальная апробация методики проведена на действующем образце когерентного оптического рефлектометра. Метод. Для компенсации постоянной составляющей шумов рефлектограммы предложено регистрировать сигнал шумов со входного тракта рефлектометра непосредственно до отправки оптического зондирующего сигнала в линию связи. Полученные таким образом данные не несут в себе полезного сигнала с линии связи. При этом данные можно использовать для определения постоянной составляющей уровня шума с помощью вычисления его среднеквадратического значения. Компенсация постоянного уровня шума осуществляется путем вычитания постоянной составляющей шумов из данных всей рефлектограммы. Основные результаты. Апробация описанной методики выполнена на действующем образце когерентного оптического рефлектометра, разработанного в научно-исследовательском центре световодной фотоники Университета ИТМО. Методика апробирована на двух тестовых волоконных линиях: оптическом волокне длиной 200 км и линии длиной 300 км с тремя оптическими усилителями. Показано, что применение методики позволяет существенно расширить динамический диапазон сигналов, представленных на рефлектограммах, на величину более 10 дБ, и повысить различимость слабых сигналов на уровне шумов прибора. Обсуждение. Практическая значимость работы заключается в возможности компенсации постоянной составляющей шумов рефлектограммы волоконно-оптической линии связи с оптическими усилителями без калибровок и предварительных настроек когерентного оптического рефлектометра.
913
Введение. В отрасли грузоперевозок активно применяются датчики веса. В системах взвешивания при движении автотранспортных средств в качестве чувствительных элементов используются керамические, полимерные, кварцевые пьезоэлектрические сенсоры, нагрузочные или гидравлические ячейки, тензометрические датчики. Однако большинство электрических датчиков подвержены влиянию электромагнитных помех. В настоящее время наиболее активно развиваются и внедряются в эксплуатацию волоконно-оптические датчики, благодаря их относительно низкой стоимости, малым массогабаритным параметрам, высокой точности измерений и полной пассивности к электромагнитным возмущениям. Волоконно-оптические датчики, как правило, основаны на применении волоконных решеток Брэгга с учетом удобства их мультиплексирования. Механические деформации чувствительного элемента датчика приводят к сдвигу длины волны брэгговского резонанса решетки. При этом проблема применения волоконных решеток связана с их чувствительностью к температуре. Для достижения высокой точности измерений величины деформации, соответственно, и весовых характеристик объекта, требуется устранение или компенсация влияния температуры датчика на его показания. Большинство современных исследований дают описание датчиков, работающих в лабораторных условиях, или используют дополнительный сенсор для измерения температуры. Метод. В работе предложен метод решения проблемы перекрестной чувствительности волоконной дифракционной структуры к температуре и деформации. Метод основан на применении в чувствительном элементе датчика пары близкорасположенных решеток. Одна из решеток имеет постоянный период по длине, а другая — переменный. Конструкция чувствительного элемента обеспечивает передачу механической нагрузки только на волоконную решетку с постоянным периодом, а изменение температуры одинаково влияет на обе дифракционные структуры. Основные результаты. Предложено конструктивное решение чувствительного элемента, которое позволило осуществить компенсацию температурного воздействия без использования дополнительных элементов. Приведена математическая модель температурного воздействия, позволяющая оценить зависимость температурного градиента от времени при различных толщинах чувствительного элемента. Моделирование показало, что для образца толщиной 0,95 см температурный градиент внутри подложки незначителен. При резком изменении температуры выравнивание температурного поля в пределах подложки на уровне 90 % происходит не более, чем за 2,5 с. Механическая нагрузка на чувствительный элемент может проходить относительно волоконной решетки под различными углами, в связи с чем детально исследована величина сдвига центральной длины волны брэгговского резонанса в зависимости от точки приложения и направления нагрузки. Обсуждение. Предлагаемая технология может представлять интерес при разработке и эксплуатации автоматических систем весогабаритного контроля с температурной компенсацией без применения дополнительных датчиков. Предложенная система проста в эксплуатации и обладает невысокой стоимостью.
923
Введение. Работа посвящена изучению и систематическому обобщению существующего опыта в области определения и контроля геометрических параметров различных объектов при помощи оптических методов. Метод. При поиске научных источников по тематике работы использовались открытые международные библиографические базы и поисковые машины. Для рассмотрения отбирались работы, посвященные описанию аппаратно-программных средств для бесконтактных геометрических измерений и/или восстановления 3D-формы поверхности материальных объектов, построенных на основе оптических методов, а также примеров их применения для решения практических задач. Критерием отбора рассматриваемых работ было соответствие набору ключевых слов и публикация в высокорейтинговых отечественных и зарубежных изданиях не старше 2010 года. Основные результаты. Предложена систематическая классификация описанных в рецензируемых научных изданиях оптических методов и аппаратно-программных средств для бесконтактных геометрических измерений и восстановления 3D-формы поверхности объектов. Выполнена сравнительная качественная оценка методов и аппаратно-программных средств. Выявлены методы, наиболее эффективные при решении отдельных практических задач. Обозначены основные ограничения рассмотренных методов и средств. Выделены основные тенденции развития рассмотренных методов. Установлено, что тенденции развития сопряжены с миниатюризацией и развитием технологий производства электронных компонентов, повышением чувствительности и увеличением пространственной и временной разрешающей способности детектирующих элементов. Также тенденции оказывают влияние на развитие методов расширения номенклатуры и функциональных возможностей источников излучения и на увеличение возможностей автоматизированной обработки данных. Обсуждение. Выполненный систематический обзор может быть использован при выборе оптического метода, оптимального для решения практических задач в таких областях, как неразрушающий контроль и малоинвазивная диагностика, навигация роботизированных систем, создание цифровых копий материальных объектов. Представленная работа может быть полезна студентам профильных специальностей технических учебных заведений для ознакомления с актуальным срезом современных методических и аппаратнопрограммных средств.
НОВЫЕ МАТЕРИАЛЫ И НАНОТЕХНОЛОГИИ
936
Введение. В работе впервые показана селективность люминесценции молекулярных кластеров серебра в силикатном стекле, сформированных методом ионного обмена из солевого расплава, содержащего 0,1 % AgNO3/99,9 % NaNO3 мол.%. Метод. В исследовании использованы коммерческие силикатные предметные стекла системы: SiO2-Na2O-K2O-CaO-MgO-Al2O3 с примесями Fe2O3-SO3. Молекулярные кластеры были получены методом низкотемпературного ионного обмена в расплаве 0,1 % AgNO3/99,9 % NaNO3 мол.% в течение 10 и 15 мин при температуре 320 °С. Основные результаты. Исследованы люминесцентные свойства серебряных молекулярных кластеров в ионообменном слое предметных стекол. На спектрах люминесценции обнаружены полосы кластеров серебра различного размера (Ag1–5). При этом кластеры Ag1–3 возбуждаются излучением с более короткими длинами волн, а кластеры Ag4–5 — только излучением дальнего ультрафиолетового диапазона и видимого диапазона с длиной волны до 500 нм. В процессе ионного обмена длительностью до 10 мин выявлено появление селективности люминесценции, которая возникает за счет присутствия в ионообменном слое малой концентрации кластеров различного размера Ag1–5. Обсуждение. Полученные результаты могут найти применение при разработке фоточувствительного элемента селективного детектора ультрафиолетового излучения.
943
Введение. Приведены результаты исследования по получению и характеризации квазиобъемных эпитаксиальных гетероструктур ε-Ga2O3/GaN различной толщины, содержащих V-дефекты на границе раздела. Актуальность работы обусловлена активным поиском путей создания приборных гетероструктур для устройств оптоэлектроники, работающих в глубоком ультрафиолетовом диапазоне, а также HEMT-транзисторов высокочастотной и мощной электроники. Одним из таких решений является эпитаксиальное выращивание толстого слоя ε-Ga2O3 на темплейтах с эпитаксиальным слоем GaN. ε-Ga2O3 отличается большой шириной запрещенной зоны и высокой спонтанной поляризацией. Метод. Слои оксида галия (Ga2O3) выращивались методом хлорид-гидридной газофазной эпитаксии на заранее подготовленных структурах GaN/AlN/3С-SiC/Si. В процессе охлаждения реактора до комнатной температуры, вследствие баланса коэффициентов термического расширения составляющих слоев, гетероструктура Ga2O3/GaN (с буферным слоем AlN) самопроизвольно отделяется от подложки SiC/Si. Морфология поверхности слоя Ga2O3 и поперечное сечение границы раздела в гетероструктурах Ga2O3/GaN исследовались методом растровой электронной микроскопии на микроскопе TESCAN MIRA 3. Фазовый состав и кристаллическое совершенство гетероструктуры ε-Ga2O3/GaN определялись методами рентгеновской дифракции на дифрактометре ДРОН-8 АО «ИЦ «Буревестник». Спектры пропускания гетероструктур получены методом спектрофотометрии с использованием интегрирующей сферы. Основные результаты. Показана возможность получения эпитаксиальных гетероструктур Ga2O3/GaN методом хлоридгидридной газофазной эпитаксии с последующим отделением от темплейта. Исследования методом растровой электронной микроскопии показали, что гетероструктуры Ga2O3/GaN содержат квазиобъемный слой Ga2O3 толщиной 100 мкм. Продемонстрировано, что ростовая поверхность GaN содержит V-дефекты, показан эффект заращивания V-дефектов эпитаксиальным слоем Ga2O3. Исследования методом рентгеновской дифракции позволили установить, что сформированная гетероструктура содержит монокристаллический слой ε-Ga2O3, а полная ширина на уровне половины максимума интенсивности кривой дифракционного отражения 0, 0, 10 составляет 1,8°, что свидетельствует об удовлетворительном качестве эпитаксиального слоя. Таким образом, в работе представлена возможность отслаивания эпитаксиальных слоев от темплейта для получения квазиобъемных гетероструктур ε-Ga2O3/GaN достаточно большой толщины. Обсуждение. Результаты исследования открывают новые возможности создания темплейтов и подложек для эпитаксии широкозонных полупроводниковых материалов. Перспективой дальнейших работ является оптимизация режимов роста и геометрии подобных гетероструктур с толстым слоем ε-Ga2O3.
КОМПЬЮТЕРНЫЕ СИСТЕМЫ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
949
Введение. Технологии доказательного подтверждения качества продукции оказывают положительное влияние на широкий спектр социальных и экономических процессов. Одна из проблем реализации таких технологий определяется противоречием между необходимостью обеспечения открытого доступа к информации об этапах технологического процесса и конфиденциальностью части данных. Применение строгих криптографических процедур для разрешения данного противоречия часто невозможно из-за наличия ресурсных ограничений, в частности — отсутствия непрерывной телекоммуникации между причастными сторонами. Полученные результаты направлены на обеспечение реализуемости систем прослеживаемости качества продукции в условиях ресурсных ограничений. Они базируются на новом архитектурном решении и комплексировании классических методов и средств обеспечения информационной безопасности. Метод. В работе предложена трехуровневая модель системы прослеживаемости качества продукции с контролируемым снижением качества и сценарии обеспечения непрерывности ее безопасного функционирования. Базовыми концепциями предлагаемого решения являются: разделение хранимых данных на общедоступные и конфиденциальные; процедуры «отложенного» доверенного предоставления доступа в условиях невозможности непосредственной коммуникации с одним из владельцев данных; разделение данных на шарды — функционально или территориально локализованные хранилища данных; свойства систем распределенного реестра в части обеспечения целостности и доступности данных, неотказуемости операций. Основные результаты. Приведены типовые сценарии использования иерархической системы прослеживания качества продукции, сформулировано и предложено решение задачи обеспечения информационной безопасности их реализации. Обосновывается подход к снижению уровня информационной безопасности конкретных реализаций в условиях ресурсных ограничений за счет учета специфики функционирования прикладных систем. Информационная безопасность новых результатов подтверждается компьютерным моделированием с использованием специализированных средств анализа безопасности протоколов. Обсуждение. В отличие от известных моделей, ориентированных на использование устойчивых каналов связи, централизованных моделей данных, строгих криптографических алгоритмов и значительных вычислительных ресурсов, не предполагающих получение доступа к данным при отсутствии связи с их владельцем, предлагаемое решение обеспечивает аутентифицированный контролируемый доступ к запрашиваемым конфиденциальным данным и при отсутствии коммуникации с их владельцем. Недостатком реализации рассмотренных сценариев является некоторое снижение уровня информационной безопасности, связанное с делегированием доверия третьей стороне, а также упрощением компрометации шард — узлов распределенного реестра.
962
Введение. В биологии информация о взаимодействии изучаемых белков или генов может быть представлена в виде биологического графа. Связный подграф, вершины которого выполняют общую биологическую функцию, называется активным модулем. Марковская цепь Монте-Карло (MCMC) — эффективный алгоритм для идентификации активного модуля в биологических графах. В контексте белок-белковых взаимодействий точное нахождение активного модуля позволяет определить, какое нарушение белковой функции приводит к возникновению определенных изменений (например, болезни) в биологической системе (клетке/организме). Показано, что применение MCMC совместно с обучением моделей, учитывающих топологию графа, обеспечивает более высокую точность определения активного модуля. Метод. В работе независимо используется граф белок-белковых взаимодействий (InWebIM) и сеть функциональных ассоциаций между генами GeneMANIA для обучения модели и сравнения с известным методом на основе MCMC. В качестве методов поиска активного модуля использовалась комбинация из MCMC и метода машинного обучения — градиентного бустинга — xgboost. Основные результаты. Совместное применение метода на основе MCMC и xgboost повышает точность нахождения активного модуля по сравнению с методом на основе MCMC на симулированных данных. Обсуждение. Повышение точности поиска активного модуля имеет важное значение для исследования биологических механизмов заболеваний и обнаружения отдельных белков, функционально связанных с возникновением заболеваний.
972
Введение. Представлен алгоритм решения задачи обнаружения дефектов твердых поверхностей при обучении на нулевом или малом числе примеров, который решает проблему ограниченного объема данных. Усовершенствуется существующая методология обнаружения дефектов методом с использованием машинного зрения. Метод. Предложен гибридный подход, сочетающий преимущества SSD-детектора и сиамских нейронных сетей. SSD-детектор позволяет извлекать векторные представления признаков из изображений, а сиамские нейронные сети применяются для построения пространства извлеченных признаков. Основные результаты. Показано, что новый подход обладает высокой точностью как на известных, так и на не встречавшихся ранее в обучающей выборке дефектах. По результатам тестирования на 7 различных наборах данных представленный алгоритм продемонстрировал хорошие возможности в сценариях с ограниченным числом примеров для обучения. Обсуждение. Сравнительный анализ с существующими моделями показал высокую производительность предлагаемого алгоритма и его потенциал как инновационного и эффективного решения задач универсального обнаружения дефектов твердых поверхностей.Введение. Представлен алгоритм решения задачи обнаружения дефектов твердых поверхностей при обучении на нулевом или малом числе примеров, который решает проблему ограниченного объема данных. Усовершенствуется существующая методология обнаружения дефектов методом с использованием машинного зрения. Метод. Предложен гибридный подход, сочетающий преимущества SSD-детектора и сиамских нейронных сетей. SSD-детектор позволяет извлекать векторные представления признаков из изображений, а сиамские нейронные сети применяются для построения пространства извлеченных признаков. Основные результаты. Показано, что новый подход обладает высокой точностью как на известных, так и на не встречавшихся ранее в обучающей выборке дефектах. По результатам тестирования на 7 различных наборах данных представленный алгоритм продемонстрировал хорошие возможности в сценариях с ограниченным числом примеров для обучения. Обсуждение. Сравнительный анализ с существующими моделями показал высокую производительность предлагаемого алгоритма и его потенциал как инновационного и эффективного решения задач универсального обнаружения дефектов твердых поверхностей.
982
Растущий объем пользовательского контента на платформах социальных сетей требует эффективных инструментов для понимания общественных настроений. В работе представлен подход к анализу настроений арабских твитов с использованием контролируемых методов машинного обучения. Исследована производительность трех популярных алгоритмов — опорных векторных машин (Support Vector Machines, SVM), наивного байесовского алгоритма (Naive Bayes, NB) и логистической регрессии (Logistic Regression, LR) — на двух отдельных корпусах: арабском корпусе текстов настроений (Arabic Sentiment Text Corpus, ASTC) и корпусе арабских твитов. Подход содержал четыре теста, оценивающих влияние характеристик корпуса: метода предварительной обработки, метода взвешивания и использования N-грамм на точность классификации. Первый тест позволил установить, что выбор корпуса значительно влияет на производительность модели, при этом SVM показал высокую точность на структурированном ASTC, в то время как NB лучше работает с неформальными арабскими твитами. Во втором тесте предварительная обработка, включая удаление знаков препинания и стоп-слов, привела к заметному улучшению точности классификации для арабских твитов, но оказала минимальное или даже отрицательное влияние на ASTC. Третий тест показал, что включение N-грамм дало незначительное улучшения для NB и LR в более структурированных текстах, в то время как его влияние на твиты было незначительным. Четвертый тест позволил сравнить различные методы взвешивания, показав, что SVM выиграл по сравнению с методом взвешивания TF-IDF, в то время как производительность NB оставалась стабильной независимо от подхода к взвешиванию. Полученные результаты подчеркивают важность адаптации стратегий предварительной обработки и извлечения признаков к конкретным характеристикам набора данных, что в итоге повышает точность анализа настроений в контекстах арабского языка.
991
Введение. Основная функция больших языковых моделей заключается в наиболее точной имитации поведения носителей языка. Для того чтобы отслеживать прогресс в решении этой задачи при разработке моделей, а также сравнивать конкурирующие модели между собой, необходимо создание наборов данных для объективной оценки. Распространенный тип таких наборов данных — это корпуса лингвистической приемлемости. Создание таких корпусов основывается на гипотезе о том, что большие языковые модели, как и носители языка, должны быть способны отличать грамматичные предложения от неграмматичных, которые нарушают правила грамматики целевого языка или языков. Метод. В работе представлен новый параметрический корпус для русского языка RuParam. Корпус содержит 9,5 тыс. минимальных пар предложений, различающихся по грамматичности, где каждому верному предложению соответствует минимально отличающееся от него ошибочное. Источник неграмматичности в каждой паре сопровождается экспертной лингвистической разметкой. RuParam состоит из двух частей. В первой части используется новый для задачи тестирования больших языковых моделей источник данных — лексико-грамматические тесты по русскому языку как иностранному. Вторая часть состоит из модифицированных корпусных примеров, представляющих грамматические феномены, не входящие в программу преподавания русского языка как иностранного в силу своей сложности. Основные результаты. Проведенные эксперименты над моделями показали, что наиболее высокий результат достигается моделями, при обучении которых русскому языку уделялось максимально пристальное внимание на всех этапах обучения, от подготовки данных и токенизации до написания инструкций и обучения с подкреплением (прежде всего YandexGPT и GigaChat). Мультиязычные модели, для которых не было сделано специального акцента на русском языке, показали существенно более низкие результаты. Тем не менее, даже лучшие результаты моделей далеки от оценки людей, которые справляются с задачей практически со 100 % точностью. Обсуждение. Ранжирование моделей, полученное в ходе эксперимента, показывает, что разработанный корпус действительно отражает степень владения русским языком. Полученный рейтинг может быть полезен при выборе модели для решения задач обработки естественного языка, где требуется знание грамматики: например, построение морфологических и синтаксических парсеров. В дальнейшем предложенный корпус может быть использован для тестирования собственных моделей.
999
Введение. Появление систем генеративного искусственного интеллекта оказало значительное влияние на задачи, имеющие отношение к обработке естественного языка: машинный перевод, сентимент-анализ, генерация и суммаризация текстов и т. п. Цель работы заключалась в определении особенностей автоматически сгенерированных научных текстов по сравнению с текстами, созданными авторами, а также в оценке возможностей разных методов применительно к задаче их классификации. Метод. Выполнен анализ аннотаций двух типов: собранные из научных журналов по компьютерной лингвистике и по германистике, сгенерированные по заголовкам соответствующих научных статей при помощи Generative Pre-trained Transformer (ChatGPT-4o mini). Общий объем данных составил 60 единиц. Выбор тематики работ обусловлен тем, что тексты относятся к одной предметной области, но отличаются по своей структуре. Первая группа, в которую собраны оригинальные тексты по компьютерной лингвистике, схожа с аннотациями научных работ по информационным технологиям, и содержит большое количество англоязычной терминологии. Вторая группа содержит тексты по германистике и носит более описательно-нарративный характер. Проведен анализ отличий аннотаций двух типов, выполнена их классификация по двум типам с привлечением экспертов, трех систем-детекторов для определения участия искусственного интеллекта при создании текстов (Smodin, ZeroGPT и GPTZero), а также самой системой ChatGPT-4o mini. Основные результаты. Проведенный анализ показал, что сгенерированные тексты отличаются четкой формальной структурой и соблюдением правил построения научных текстов в соответствии с IMRAD (наличием введения, методов, результатов и заключения). Содержательно они носят поверхностный характер, в них не всегда соблюдается научный стиль, присутствуют повторы конструкций и перефразирование названий статей, что не встречается в аннотациях, написанных авторами без привлечения искусственного интеллекта. Автоматически сгенерированные аннотации нуждаются не только в дальнейшей редакторской правке (поскольку в ряде случаев нарушены лексическая и синтаксическая сочетаемость, присутствует неоднозначность), но и в проверке упоминаемых фактов и терминов. Среди систем-детекторов наиболее высокие показатели по метрикам precision, accuracy и F1-score достигаются системой Smodin, в то время как по критерию Recall лучшие результаты демонстрирует система ZeroGPT. Наиболее низкие результаты при оценке аннотаций при сравнении с другими инструментами были достигнуты системой ChatGPT-4o mini. Классификация с привлечением экспертов показала наиболее высокие результаты в случае аннотаций по германистике. Обсуждение. Полученные результаты могут быть полезны исследователям при работе с научными текстами по лингвистике, а также для дальнейшего дообучения нейросетевых моделей.
1007
Введение. Kubernetes — ключевая платформа для масштабируемого и эффективного развертывания микросервисов. С увеличением масштабируемости возрастает сложность выявления и своевременного обнаружения специфических типов атак в динамичных средах Kubernetes. Метод. В работе предложен подход для повышения безопасности Kubernetes, позволяющий детектировать атаки типа «отказ в обслуживании» (Denial of Service, DoS), основанный на использовании методов машинного обучения. Подход базируется на данных, полученных от пользовательского агента мониторинга, осуществляющего сбор телеметрической информации из различных источников, включая реальные рабочие нагрузки, сценарии атак, имитацию взлома и перегрузку ресурсов в контейнерах и подах. Полученные данные размечаются и обрабатываются, включая нормализацию и временной анализ для создания полноценного набора данных. Основные результаты. В ходе экспериментов протестированы различные классификаторы машинного обучения. Наиболее высокие показатели качества получены с использованием алгоритмов Random Forest и AdaBoost, дающие макро F1-оценки 0,9990 ± 0,0006 и 0,9990 ± 0,0003 соответственно. Разработанный подход позволяет эффективно отличать перегрузки ресурсов, вызванные атаками от естественных перегрузок, и обеспечивает точное выявление DoS-атак. Предложенная модель машинного обучения демонстрирует высокую точность в обнаружении инцидентов безопасности, существенно снижая количество ложных срабатываний. Обсуждение. Полученные результаты показывают, что модели машинного обучения могут стать основой для создания проактивной системы безопасности Kubernetes, которая обеспечит надежную защиту от специфических векторов атак, сохраняя при этом стабильность системы. Полученные результаты могут быть полезны исследователям и специалистам в области кибербезопасности приложения Kubernetes.
1016
Введение. Экспоненциальный рост цифровой информации требует устойчивых методов текстового поиска, поскольку большинство методов направлено на решение конкретной задачи или домена, что ограничивает их использование. Решением в таком случае могут являться многозадачные модели, требующие использования методов разделения задач. Многие исследования изучают многозадачное обучение для улучшения обобщения и фокусируются на больших моделях. Вместе с тем в реальных задачах речевой аналитики, требующих поиска среди сотен миллионов векторов в реальном времени, более подходящими становятся модели меньшего размера. Метод. В работе представлен новый подход к повышению устойчивости многозадачных моделей текстового поиска на основе префиксов. Применяется контрастное обучение как для многозадачных, так и однозадачных моделей-энкодеров. Выполнено сравнение моделей на устойчивость и проанализирована эффективность различных стратегий использования подсказок, включая жесткие, представленные явными инструкциями на естественном языке (инструктивные префиксы), и мягкие подсказки разной длины, представленные специальными токенами модели (обучаемые префиксы) разной длины. Эксперименты выполнены с применением подсказок как к запросу и кандидату, так и отдельно к запросам, для повторного использования предварительно закодированных кандидатов в многозадачном поиске без значительной потери качества. Основные результаты. Проведено сравнение полученных результатов по метрикам R@1, R@5 и MRR, являющимися наиболее применимыми для оценки поисковых моделей внутри и вне домена обучения. Однозадачные модели показали себя лучше при работе с данными в пределах домена обучения. Многозадачные модели продемонстрировали лучшую применимость на данных вне домена обучения, что подчеркивает их повышенную устойчивость к его смене. Для сохранения этого свойства в данной работе рассмотрено применение префиксов к обоим элементам — запросу и документу, что обеспечивает лучшую устойчивость, чем их обособленное применение к запросу. Обучаемые префиксы оказались более предпочтительными по сравнению с инструктивными, поскольку они лучше адаптируют модель к различным доменам. Обсуждение. Результаты исследования могут быть полезны для улучшения моделей текстового поиска, особенно в сценариях, связанных с многозадачными системами, где требуется высокая адаптивность и производительность на новых данных. Обучаемые префиксы могут быть эффективным инструментом повышения устойчивости моделей в различных приложениях, таких как информационный поиск и системы вопросов-ответов.
1024
Введение. Тематические вопросно-ответные онлайн-форумы предметных сообществ, такие как Stack Overflow, сегодня становятся незаменим инструментом разработчиков программного обеспечения. Форумы обеспечивают быстрый и эффективный поиск решений и оперативный отклик сообщества. Современные большие языковые модели, обучаемые, в том числе, на данных таких форумов, обладают потенциалом для автоматизации ответов на тематические вопросы. Но часто языковые модели демонстрируют существенную ограниченность в сложных областях, таких как программирование из-за разнородности области и контекстов задаваемых вопросов. Метод. В работе представлен подход к решению проблемы разнородных данных на основе структурирования данных сложной предметной области. На первом этапе предлагается декомпозиция доступных данных форумов с выделением тематических подмножеств. Далее, для отдельных тематик происходит дообучение моделей, применяя обучение с подкреплением с человеческой обратной связью (Reinforcement Learning with Human Feedback, RLHF) с использованием пользовательских оценок доступных в данных. Для управления ансамблем дообученных моделей используется классификация вопросов с последующим выбором соответствующей модели. Основные результаты. Экспериментальные исследования были проведены на подмножестве вопросов, связанных с Python, из Stack Overflow, с использованием модели Llama 7B в качестве базовой языковой модели. Результаты исследований показали, что путем классификации вопросов возможно повысить производительность модели до +22,5 % по метрике Rouge. Кроме того, включение RLHF привело к дополнительному улучшению до +11,2 %. Для валидации этих результатов выполнена экспертная оценка сгенерированных ответов, которая подтвердила эффективность представленного подхода. Обсуждение. Исследование показывает, что путем структурирования данных онлайн-форумов и обработки неявной обратной связи возможно значительно улучшить производительность больших языковых моделей в таких сложных областях, характеризующихся высокой неоднородностью, как разработка программного обеспечения.
1035
Введение. Автоматное программирование — парадигма программирования, успешно применяемая при разработке реагирующих систем, распределенных систем управления и различных ответственных приложений, где критически важна возможность верификации соответствия реальной системы ее модели, заданной в виде спецификаций. Традиционное тестирование таких систем может быть затруднено, поэтому требуются более совершенные средства верификации для повышения степени доверия к надежности реальной системы. Предложенный ранее язык спецификации кооперативного взаимодействия автоматных объектов (Cooperative Interaction of Automata Objects, CIAO) был успешно применен для разработки нескольких реагирующих систем. Однако он также выявил ряд недостатков, которые устранены в CIAO v.3. Метод. Новая версия языка разработана с целью автоматической верификации автоматных программ по формальным спецификациям определенного класса систем реального времени. CIAO v.3 содержит три нововведения в отличие от предшествующих версий. Во-первых, явное разграничение автоматных классов и автоматных объектов как экземпляров этих классов. Во-вторых, спецификация связывания автоматных объектов через интерфейсы с помощью схемы связей. В-третьих, описание семантики поведения системы взаимодействующих автоматных объектов с помощью семантического граф а. Основные результаты. В работе представлены основные концепции новой версии языка, приведены абстрактный синтаксис, операционная семантика и метамодель. Обсуждение. CIAO v.3 позволяет естественным образом включить в парадигму автоматного программирования почти все преимущества объектноориентированного программирования. Подключение автоматных объектов через соответствующие интерфейсы произвольным образом отражает схема связей. Семантический граф, описывающий семантику поведения автоматной программы, используется для реализации автоматической верификации относительно некоторых формальных спецификаций.
1044
Введение. Рассмотрена структура представления графа межагентных связей для повышения эффективности взаимодействия агентов в кооперативных состязательных играх с использованием графовых нейронных сетей. Метод. Выполнена сравнительная оценка метрик и матриц смежности для графов связей, задаваемых с применением геометрической и семантической метрик близости. Основные результаты. Показано, что семантическая близость более эффективна при построении графа межагентных связей, а применение орграфов обеспечивает гибкое управление информационными потоками. Обсуждение. Предложенные закономерности важно учитывать при организации многоагентного обучения с подкреплением в широком диапазоне областей применения.
МАТЕМАТИЧЕСКОЕ И КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ
1049
Введение. Наиболее распространенной технологией производства водорода является паровая конверсия метана. Ключевым недостатком конверсии считаются существенные выбросы углекислого газа в атмосферу, обусловленные наличием сжигания природного газа в воздухе в печи риформера. Решить данную проблему возможно за счет перехода на кислородное сжигание органического топлива. В настоящей работе представлены результаты разработки новой технологической схемы установки паровой конверсии метана. Выполнен сравнительный анализ разработанной схемы энергетических и экологических характеристик с ближайшим аналогом: установкой паровой конверсии метана с моноэтаноламиновой очисткой уходящих газов. Метод. Для проведения термодинамического анализа вариантов технологических схем с использованием программного пакета Aspen Plus разработаны математические модели. Модели включают последовательно решаемые уравнения процессов кислородного горения топлива и реакции: парового риформинга, водяного сдвига и абсорбции моноэтаноламином. При моделировании учитывалась возможность протекания двух побочных реакций: паровой конверсии монооксида углерода и углекислотной конверсии метана. Для определения термодинамических свойств веществ использовалась база данных NIST REFPROP. Основные результаты. По результатам термодинамического анализа установлено, что для предложенной технологической схемы установки паровой конверсии метана с кислородным сжиганием топлива повышение температуры с 850 до 1050 °С приводит к снижению массового расхода природного газа на 14,4 %. При этом оптимальная с термодинамической точки зрения температура в риформере, равная 950 °С, обеспечивает возможность достижения значения коэффициента использования теплоты топлива на уровне 79,2 %. Результаты сравнения энергетических и экологических характеристик двух рассматриваемых установок паровой конверсии метана позволили прийти к выводу, что предложенная схема с кислородным сжиганием топлива имеет два преимущества по сравнению со схемой с улавливанием углекислого газа абсорбцией моноэтаноламином: более высокая энергоэффективность (коэффициент полезного действия нетто выше на 2,12 %), более низкие выбросы парникового газа (выбросы ниже в 14,5 раз). Обсуждение. Предложенная технологическая схема, а также разработанные математические модели могут быть использованы при разработке высокоэффективных установок паровой конверсии метана с минимальными выбросами вредных веществ в атмосферу.
1059
Введение. Рассматривается проблема оценки стабильности наноэлектронных структур, включающих гибридную транзисторно-мемристорную энергонезависимую память. Результаты исследования процессов в наноэлектронных структурах с использованием мемристоров показали, что дополнительно к обычному дрейфу параметров, свойственному полупроводниковым приборам, в данных структурах возникают новые уникальные эффекты. Такие эффекты приводят к неопределенности в оценке состояния ячеек мемристорной памяти. Исследование подобных эффектов находится в начальном состоянии, в том числе из-за отсутствия моделей, позволяющих в полном объеме исследовать изменчивость параметров и дрейф состояний мемристоров. В связи с этим предлагается использовать метаэвристический метод роя частиц, позволяющий оценивать устойчивость гибридной транзисторно-мемристорной памяти. Методы. В работе используются методы топологического и параметрического анализов наноэлектронных структур с мемристорами, метод интервального анализа подобных структур, метод оптимизации роя частиц для решения интервальных алгебраических и дифференциальных уравнений. Основные результаты. Предложена структурно-параметрическая модель гибридного устройства памяти на основе мемристоров с учетом конечных приращений их параметров, вызванных воздействием внешних и внутренних факторов. Разработан алгоритм оценки параметров гибридного запоминающего устройства с мемристорами на основе модифицированного метода оптимизации роя частиц. Обсуждение. Интервальные математические модели служат основой для разработки новых принципов организации сверхплотной энергонезависимой памяти и создают предпосылки для новых подходов к организации вычислений в памяти. Вычислительный алгоритм, основанный на методе оптимизации роя частиц, позволяет оценить работоспособность гибридных металл-оксид-полупроводниковых структур (МОП-структур) с мемристорами в реальных условиях эксплуатации. В результате выполненной оценки появляется возможность расширить область применения устройств, использующих квантовые эффекты, в различных технических приложениях.
КРАТКИЕ СООБЩЕНИЯ
1066
Представлен анализ формализованных условий создания универсальных изображений, ложно классифицируемых алгоритмами компьютерного зрения, называемыми состязательными примерами, на нейросетевые модели YOLO. Выявлена и исследована закономерность успешного создания универсального деструктивного изображения в зависимости от сгенерированного набора данных, на котором происходило обучение нейронных сетей с помощью атаки Fast Sign Gradient Method. Указанная закономерность продемонстрирована для моделей классификатора YOLO8, YOLO9, YOLO10, YOLO11, обученных на стандартном наборе данных COCO.