doi: 10.17586/2226-1494-2020-20-6-


УДК 28.17.19

ВЫВОД ГЕННЫХ РЕГУЛЯТОРНЫХ СЕТЕЙ ПО ДАННЫМ ЭКСПРЕССИИ ГЕНОВ ПРИ ПОМОЩИ БАЙЕСОВСКИХ СЕТЕЙ

Лобода А.А., Сергушичев А.А.


Читать статью полностью 
Ссылка для цитирования:

Лобода А.А., Сергушичев А.А. Вывод генных регуляторных сетей по данным экспрессии генов при помощи байесовских сетей // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 20. № 6. С. doi: 10.17586/2226-1494-2020-20-6-



Аннотация

Предмет исследования.Рассмотрена задача вывода генных регуляторных сетей в форме байесовских сетей из данных экспрессии геновкак задача оценки частной вероятности вхождения каждого ребра в истинную байесовскую сеть при известных уровнях экспрессии генов. Для решения задачи предложен метод, использующий подход Монте-Карло на основе марковских цепей. Метод. Предлагаемый метод состоит в сэмплировании пар из байесовской сети и дискретизационной политики, позволяющей применять сеть к данным экспрессии генов согласно апостериорному распределению. Для сэмплирования используется подход Монте-Карло на основе марковских цепей с реализацией с помощью алгоритма Метрополиса–Гастингса. На основе полученной выборкивыполняется оценка искомых вероятностей. Результаты. Предложенный метод протестирован на симулированных данных из соревнования DREAM4 Challenges. Сравнение с лидерами показало, что качество разработанного метода на некоторых тестах превосходит лидера из существующих методов – метод regularized gradient boosting machines (RGBM) – и сравнимо на остальных тестах. В то же время метод является довольно гибким и позволяет адаптировать его к другим видам экспериментальных данных. Практическая значимость. Метод может быть использован в вычислительной биологии для изучения механизмов регуляции генов в различных процессах, в том числе в развитии опухолей или работе иммунной системы.


Ключевые слова: генные регуляторные сети, байесовские сети, дискретизация, методы Монте-Карло, марковские цепи

Список литературы
1. Csermely P., Ágoston V., Pongor S. The efficiency of multi-target drugs: the network approach might help drug design // Trends in Pharmacological Sciences. 2005. V. 26. N 4. P. 178–182. doi: 10.1016/j.tips.2005.02.007
2. Schaffter T., Marbach D., Floreano D. GeneNetWeaver: in silico benchmark generation and performance profiling of network inference methods // Bioinformatics. 2011. V. 27. N 16. P. 2263–2270. doi: 10.1093/bioinformatics/btr373
3. Marbach D., Costello J.C., Küffner R., Vega N.M., Prill R.J., Camacho D.M., Allison K.R., Kellis M., Collins J.J., Aderhold A., Stolovitzky G., Bonneau R., Chen Y., Cordero F., Crane M., Dondelinger F., Drton M., Esposito R., Foygel R., De La Fuente A., Gertheiss J., Geurts P., Greenfield A., Grzegorczyk M., Haury A.-C., Holmes B., Hothorn T., Husmeier D., Huynh-Thu V.A., Irrthum A., Karlebach G., Lèbre S., De Leo V., Madar A., Mani S., Mordelet F., Ostrer H., Ouyang Z., Pandya R., Petri T., Pinna A., Poultney C.S., Rezny S., Ruskin H.J., Saeys Y., Shamir R., Sîrbu A., Song M., Soranzo N., Statnikov A., Vega N., Vera-Licona P., Vert J.-P., Visconti A., Wang H., Wehenkel L., Windhager L., Zhang Y., Zimmer R. Wisdom of crowds for robust gene network inference // Nature Methods. 2012. V. 9. N 8. P. 796–804. doi: 10.1038/nmeth.2016
4. Friedman N., Linial M., Nachman I., Pe'er D. Using Bayesian networks to analyze expression data // Journal of Computational Biology. 2000. V. 7. N 3-4. P. 601–620. doi: 10.1089/106652700750050961
5. Aghdam R., Ganjali M., Zhang X., Eslahchi C. CN: a consensus algorithm for inferring gene regulatory networks using the SORDER algorithm and conditional mutual information test // Molecular BioSystems. 2015. V. 11. N 3. P. 942–949. doi: 10.1039/c4mb00413b
6. Husmeier D. Sensitivity and specificity of inferring genetic regulatory interactions from microarray experiments with dynamic Bayesian networks // Bioinformatics. 2003. V. 19. N 17. P. 2271–2282. doi: 10.1093/bioinformatics/btg313
7. Liu F., Zhang S.-W., Guo W.-F., Wei Z.-G., Chen L. Inference of gene regulatory network based on local bayesian networks // PLoS Computational Biology. 2016. V. 12. N 8. P. e1005024. doi: 10.1371/journal.pcbi.1005024
8. Chen Y.-C., Wheeler T.A., Kochenderfer M.J. Learning discrete Bayesian networks from continuous data // Journal of Artificial Intelligence Research. 2017. V. 59. P. 103–132. doi: 10.1613/jair.5371
9. Buntine W. Theory refinement on Bayesian networks // Proc. 7th Conference on Uncertainty in Artificial Intelligence. 1991. P. 52–60. doi: 0.1016/B978-1-55860-203-8.50010-3
10. Hastings W.K. Monte Carlo sampling methods using Markov chains and their applications // Biometrika. 1970. V. 57. N 1. P. 97–109. doi: 10.1093/biomet/57.1.97
11. Chib S., Greenberg E. Understanding the metropolis-hastings algorithm // American Statistician. 1995. V. 49. N 4. P. 327–335. doi: 10.1080/00031305.1995.10476177
12. Кормен Т.Х., Лейзерсон Ч.И., Ривест Р.Л., Штайн К. Алгоритмы: построение и анализ: [пер. с англ.]. М.: Издательский дом Вильямс, 2009. 1290 с.
13. Albert R. Scale-free networks in cell biology // Journal of Cell Science. 2005. V. 118. N 21. P. 4947–4957. doi: 10.1242/jcs.02714
14. Mall R., Cerulo L., Garofano L., Frattini V., Kunji K., Bensmail H., Sabedot T.S., Noushmehr H., Lasorella A., Iavarone A., Ceccarelli M. RGBM: regularized gradient boosting machines for identification of the transcriptional regulators of discrete glioma subtypes // Nucleic Acids Research. 2018. V. 46. N 7. P. e39. doi: 10.1093/nar/gky015
15. Petralia F., Wang P., Yang J., Tu Z. Integrative random forest for gene regulatory network inference // Bioinformatics. 2015. V. 31. N 12. P. i197–i205. doi: 10.1093/bioinformatics/btv268


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2020 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика