Меню
Публикации
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор
НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
doi: 10.17586/2226-1494-2021-21-3-433-436
УДК 004.912
Автоматическое определение типа аллергии из неструктурированных медицинских текстов на русском языке
Читать статью полностью
Язык статьи - русский
Ссылка для цитирования:
Аннотация
Ссылка для цитирования:
Ленивцева Ю.Д., Копаница Г.Д. Автоматическое определение типа аллергии из неструктурированных медицинских текстов на русском языке // Научно-технический вестник информационных технологий, механики и оптики. 2021. Т. 21, № 3. С. 433–436. doi: 10.17586/2226-1494-2021-21-3-433-436
Аннотация
Большая часть медицинских данных в базах медицинских информационных систем хранится в неструктурированном виде. Методы обработки неструктурированных записей широко представлены в литературе для английского языка. В работе предложен метод интеллектуального анализа неструктурированных аллергологических анамнезов на русском языке с целью определения наличия и типа аллергии и непереносимости у пациента. В основе метода лежат алгоритмы машинного обучения, а также используются международные стандарты обмена медицинскими данными, такие как FHIR и SNOMED CT. В результате эксперимента обработано около 12 тысяч медицинских записей. Значение F-меры для разработанных моделей классификации составило от 0,93 до 0,96. Полученные модели показали высокие значения метрик оценки эффективности моделей. В дальнейшем структурированные данные могут быть использованы в моделях предсказания медицинских рисков. Развитие методов структурирования медицинских текстов обеспечит интероперабельность медицинских данных.
Ключевые слова: структурирование медицинских данных, аллергия, непереносимость, машинное обучение, анализ неструктурированных текстов, интероперабельность
Список литературы
Список литературы
1. Lenivtceva I.D., Kopanitsa G. Evaluating manual mappings of Russian proprietary formats and terminologies to FHIR // Methods of Information in Medicine. 2019. V. 58. N 4-5. P. 151–159. doi: 10.1055/s-0040-1702154
2. Fung K.W., Xu J., Rosenbloom S.T., Campbell J.R. Using SNOMED CT-encoded problems to improve ICD-10-CM coding—A randomized controlled experiment // International Journal of Medical Informatics. 2019. V. 126. P. 19–25. doi: 10.1016/j.ijmedinf.2019.03.002
3. Fiebeck J., Gietzelt M., Ballout S., Christmann M., Fradziak M., Laser H., Ruppel J., Schönfeld N., Teppner S., Gerbel S. Implementing LOINC: Current status and ongoing work at the Hannover Medical School // Studies in Health Technology and Informatics. 2019. V. 258. P. 247–248. doi: 10.3233/978-1-61499-959-1-247
4. Mascia C., Uva P., Leo S., Zanetti G. OpenEHR modeling for genomics in clinical practice // International Journal of Medical Informatics. 2018. V. 120. P. 147–156. doi: 10.1016/j.ijmedinf.2018.10.007
5. Santos M.R., Bax M.P., Kalra D. Building a logical EHR architecture based on ISO 13606 standard and semantic web technologies // Studies in Health Technology and Informatics. 2010. V. 160. N 1. P. 161–165. doi: 10.3233/978-1-60750-588-4-161
6. Ulrich H., Kock A.-K., Duhm-Harbeck P., Habermann J.K., Ingenerf J. Metadata repository for improved data sharing and reuse based on HL7 FHIR // Studies in Health Technology and Informatics. 2017. V. 228. P. 162–166. doi: 10.3233/978-1-61499-678-1-162
7. Hong N., Wen A., Mojarad M.R., Sohn S., Liu H., Jiang G. Standardizing heterogeneous annotation corpora using HL7 FHIR for facilitating their reuse and integration in clinical NLP // AMIA Annual Symposium Proceedings. American Medical Informatics Association, 2018. V. 2018. P. 574–583.
8. Dudchenko A., Dudchenko P., Ganzinger M., Kopanitsa G. Extraction from medical records // Studies in Health Technology and Informatics. 2019. V. 261. P. 62–67. doi: 10.3233/978-1-61499-975-1-62
9. Oleynik M., Kugic A., Kasáč Z., Kreuzthaler M. Evaluating shallow and deep learning strategies for the 2018 n2c2 shared task on clinical text classification // Journal of the American Medical Informatics Association. 2019. V. 26. N 11. P. 1247–1254. doi: 10.1093/jamia/ocz149