doi: 10.17586/2226-1494-2020-20-6-888-892


УДК 519.1

ПРИМЕНЕНИЕ МЕТОДА НЕЗАВИСИМЫХ КОМПОНЕНТ ДЛЯ ОПРЕДЕЛЕНИЯ НАЧАЛЬНОГО ПРИБЛИЖЕНИЯ ПРИ ПОИСКЕ АКТИВНЫХ МОДУЛЕЙ В БИОЛОГИЧЕСКИХ ГРАФАХ

Гайнуллина А.Н., Сухов В.Д., Шалыто А.А., Сергушичев А.А.


Читать статью полностью 
Ссылка для цитирования:

Гайнуллина А.Н., Сухов В.Д., Шалыто А.А., Сергушичев А.А. Применение метода независимых компонент для определения начального приближения при поиске активных модулей в биологических графах // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 20. № 6. С. 888-892. doi: 10.17586/2226-1494-2020-20-6-888-892



Аннотация

Предмет исследования. Поиск активных модулей в биологических графах, в том числе в генных графах, является одним из важных подходов к интерпретации экспериментальных биологических данных. Один из методов ее решения основан на применении алгоритма совместной кластеризации в графовом и корреляционном пространствах. Алгоритм находит группы генов, одновременно близко расположенные в генном графе и обладающие высокой попарной корреляцией по матрице значений экспрессии генов. Алгоритм является итеративным, одиниз его ключевых параметров–выбранное начальное приближение, от которого зависит время работы и качество получаемых результатов. В настоящей работе рассмотрена задача определения начального приближения для этого алгоритма. Для решения задачи предложено использование процедуры на основе метода независимых компонент. Метод. На первом шаге предлагаемой процедуры определения начального приближения применяется метод независимых компонент к центрированной матрице значений экспрессии генов. Далее для каждой компоненты определяются гены, которые ей соответствуют с заданным уровнем статистической значимости. Полученные группы генов для всех независимых компонент выбираются в качестве начального приближения. Основные результаты. Применение процедуры на основе метода независимых компонент позволитуменьшить число групп генов в начальном приближении без потери точности, что, в свою очередь, уменьшитвремя работы алгоритма кластеризации в десяткираз при сохранении качества результатов. Практическая значимость. Ускорение работы алгоритма совместной кластеризации в графовом и корреляционном пространствах без потери качества результатов значительно повыситудобство его использования для интерпретации транскриптомных данных в биоинформатике и вычислительной биологии.


Ключевые слова: кластеризация, корреляция, метод независимых компонент, графы, экспрессия генов

Благодарности. Работа выполнена при поддержке Правительства Российской Федерации, субсидия 08-08.

Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2020 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика