doi: 10.17586/2226-1494-2021-21-3-433-436


УДК 004.912

Автоматическое определение типа аллергии из неструктурированных медицинских текстов на русском языке

Ленивцева Ю.Д., Копаница Г.Д.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования:

Ленивцева Ю.Д., Копаница Г.Д. Автоматическое определение типа аллергии из неструктурированных медицинских текстов на русском языке // Научно-технический вестник информационных технологий, механики и оптики. 2021. Т. 21, № 3. С. 433–436. doi: 10.17586/2226-1494-2021-21-3-433-436



Аннотация
Большая часть медицинских данных в базах медицинских информационных систем хранится в неструктурированном виде. Методы обработки неструктурированных записей широко представлены в литературе для английского языка. В работе предложен метод интеллектуального анализа неструктурированных аллергологических анамнезов на русском языке с целью определения наличия и типа аллергии и непереносимости у пациента. В основе метода лежат алгоритмы машинного обучения, а также используются международные стандарты обмена медицинскими данными, такие как FHIR и SNOMED CT. В результате эксперимента обработано около 12 тысяч медицинских записей. Значение F-меры для разработанных моделей классификации составило от 0,93 до 0,96. Полученные модели показали высокие значения метрик оценки эффективности моделей. В дальнейшем структурированные данные могут быть использованы в моделях предсказания медицинских рисков. Развитие методов структурирования медицинских текстов обеспечит интероперабельность медицинских данных.

Ключевые слова: структурирование медицинских данных, аллергия, непереносимость, машинное обучение, анализ неструктурированных текстов, интероперабельность

Список литературы
1. Lenivtceva I.D., Kopanitsa G. Evaluating manual mappings of Russian proprietary formats and terminologies to FHIR // Methods of Information in Medicine. 2019. V. 58. N 4-5. P. 151–159. doi: 10.1055/s-0040-1702154
2. Fung K.W., Xu J., Rosenbloom S.T., Campbell J.R. Using SNOMED CT-encoded problems to improve ICD-10-CM coding—A randomized controlled experiment // International Journal of Medical Informatics. 2019. V. 126. P. 19–25. doi: 10.1016/j.ijmedinf.2019.03.002
3. Fiebeck J., Gietzelt M., Ballout S., Christmann M., Fradziak M., Laser H., Ruppel J., Schönfeld N., Teppner S., Gerbel S. Implementing LOINC: Current status and ongoing work at the Hannover Medical School // Studies in Health Technology and Informatics. 2019. V. 258. P. 247–248. doi: 10.3233/978-1-61499-959-1-247
4. Mascia C., Uva P., Leo S., Zanetti G. OpenEHR modeling for genomics in clinical practice // International Journal of Medical Informatics. 2018. V. 120. P. 147–156. doi: 10.1016/j.ijmedinf.2018.10.007
5. Santos M.R., Bax M.P., Kalra D. Building a logical EHR architecture based on ISO 13606 standard and semantic web technologies // Studies in Health Technology and Informatics. 2010. V. 160. N 1. P. 161–165. doi: 10.3233/978-1-60750-588-4-161
6. Ulrich H., Kock A.-K., Duhm-Harbeck P., Habermann J.K., Ingenerf J. Metadata repository for improved data sharing and reuse based on HL7 FHIR // Studies in Health Technology and Informatics. 2017. V. 228. P. 162–166. doi: 10.3233/978-1-61499-678-1-162
7. Hong N., Wen A., Mojarad M.R., Sohn S., Liu H., Jiang G. Standardizing heterogeneous annotation corpora using HL7 FHIR for facilitating their reuse and integration in clinical NLP // AMIA Annual Symposium Proceedings. American Medical Informatics Association, 2018. V. 2018. P. 574–583.
8. Dudchenko A., Dudchenko P., Ganzinger M., Kopanitsa G. Extraction from medical records // Studies in Health Technology and Informatics. 2019. V. 261. P. 62–67. doi: 10.3233/978-1-61499-975-1-62
9. Oleynik M., Kugic A., Kasáč Z., Kreuzthaler M. Evaluating shallow and deep learning strategies for the 2018 n2c2 shared task on clinical text classification // Journal of the American Medical Informatics Association. 2019. V. 26. N 11. P. 1247–1254. doi: 10.1093/jamia/ocz149


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2021 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика