Результаты разработки унифицированной национальной медицинской номенклатуры представили на ИТМ-2024

В прошлом году на конгрессе ИТМ заведующая лабораторией семантического анализа медицинской информации Института цифровой трансформации медицины РНИМУ им. Пирогова Светлана Раузина анонсировала создание унифицированной национальной медицинской номенклатуры. На ИТМ-2024 она представила предварительные результаты этой работы и рассказала о перспективах использования номенклатуры в практической деятельности.

По словам Раузиной, основное назначение унифицированной номенклатуры на национальном уровне — семантическое обеспечение совместимости медицинской информации и создание терминологической платформы для разработок разных разработчиков, баз, знаний, информационно-поисковых систем и систем поддержки принятия решений.

«Мы оттолкнулись в своей работе от унифицированного языка медицинских систем Unified Medical Language System (UMLS), в котором представлено около 5 млн унифицированных терминов из разных областей медицины, взаимосвязанных между собой, и формулировки для этих унифицированных терминов приходят из разных известных медицинских словарей, — отметила Светлана Раузина. — Русификация в UMLS представлена плохо, поэтому встал вопрос адаптации системы».

Адаптация шла по трем направлениями. Первое — экспертное уточнение переводов. Второе — сопоставление со справочниками федерального реестра нормативно-справочной информации Минздрава России. Третье — создание собственных справочников на основе анализа медицинской литературы, данных реальной клинической практики.

«Какие решения мы можем уже предложить для реальной практики? Собственно аннотатор — выделение из неструктурированных медицинских текстов, а это могут быть и свободная запись врача, и клинические рекомендации, и нормативно-правовые акты в сфере медицины, унифицированных терминов и отнесение их к семантическим группам», — прокомментировала спикер.

В основе анализа лежат нейросети класса трансформеры с собственными правилами и алгоритмами, внедренными в совокупности. Аннотатор находит соответствие концептам из федерального реестра нормативно-справочной информации, выбирая нужную строку из справочника и показывая, какие справочники содержат такие термины, что отличает данный аннотатор от аналогов.

«Он может определять смысловую двойственность. Он отыскивает разбитые словами фразы: если термин состоит из нескольких слов, и эти слова разбиваются какими-то другими, то в пределах пять-семь слов он может найти нужный термин, в каком бы порядке слова ни стояли в предложении», — констатировала докладчик.

Самое существенное: результат высокого уровня получается автоматизированным способом, подытожила Раузина. Это позволяет значительно сократить усилия и время, потраченные на экспертную работу.

«Со временем мы сделаем инструмент — чат-бот, который поможет решить проблемы коморбидности состояний пациентов. В настоящее время он построен с использованием больших языковых моделей и отрабатывается на нескольких направлениях: клинические рекомендации, стандарты оказания медицинской помощи, пробуем использовать его для медицинской литературы, статей», — резюмировала спикер.