Ведущие научные сотрудники Объединенного института проблем информатики НАН Беларуси Ольга Красько и Наталья Новоселова разработали методы и модели анализа биомедицинских данных, информационно-аналитические системы прогноза выживаемости и диагностики социально значимых заболеваний. За соответствующий цикл работ они были удостоены премии НАН Беларуси 2021 года в области информационных технологий. Подробнее о результатах своих исследований ученые рассказали корреспонденту «Медвестника».
Увидеть общую картину
Ольга Красько:
— Сразу хочу сказать, что мы с коллегой работаем над разными направлениями, но для одной цели — повысить точность диагностики социально значимых заболеваний, выйти на назначение адекватной терапии и улучшить прогноз выживаемости для пациента.
В частности, я занимаюсь клинической эпидемиологией: разрабатываю модели, которые используются для дифференциальной диагностики, сравнения протоколов лечения, выявления особенностей течения заболеваний. Но важно отметить, что без участия медиков-исследователей это направление невозможно было бы реализовать.
Я очень благодарна им за то, что мне доверяют клинические данные пациентов, результаты экспериментов и позволяют их анализировать. Мы активно сотрудничаем со многими учреждениями, в том числе РНПЦ детской онкологии, гематологии и иммунологии, РНПЦ онкологии и медрадиологии им. Н. Н. Александрова, Республиканским центром опухолей щитовидной железы, кафедрой инфекционных болезней БГМУ, МНПЦ хирургии, трансплантологии и гематологии, РНПЦ «Кардиология» и другими.
Природа не создавала математику. Однако именно математика позволяет систематизировать и описать единым универсальным языком явления и процессы, происходящие в природе, в том числе в человеческом организме, создать модели поведения тех или иных параметров при различных патологиях, выявить показатели-предикторы, которые важны для пояснения механизма, течения заболевания, лечения и исхода.
Клиническая эпидемиология как раздел доказательной медицины сосредоточена на изучении клинико-лабораторных, инструментальных, генетических, цитохимических и других показателей пациентов.
Методология науки использует математический аппарат и статистические методы для изучения природы, мира, социума, человеческого организма. С помощью этих методов мы можем ответить на ряд важных вопросов, например, какова вероятность наступления заболевания при наличии факторов риска, какой протокол лечения выбрать, нужно ли проводить дополнительную терапию, какова вероятность рецидива и неблагоприятного исхода спустя некоторое время и множество других специфических вопросов.
Изучая модель, можно понять гораздо больше в механизмах развития заболеваний. Хорошие клиницисты рассматривают каждый случай отдельно, каждого пациента — индивидуально. А математика и статистика, в частности, обобщив и генерализировав данные, позволяют увидеть общую картину, опустив несущественные детали.
Исследования проводились в области онкологии (папиллярный рак щитовидной железы, рак желудка и другие формы раковых заболеваний), кардиологии (кардиомиопатии), инфекционных болезней и других. И каждый раз мы находили особенности развития и течения патологии, проведения терапии и/или хирургических вмешательств, ведения постоперационного периода, возникновения отдаленных последствий и исходов.
Модели можно разрабатывать для любых заболеваний, если имеются эмпирические данные. Однако математика различных заболеваний различна, например, при хронических патологиях модели строятся вокруг контроля за состоянием пациента в отличие от онкозаболеваний, в которых основное место занимает прогноз выживаемости.
Определить на клеточном уровне
Наталья Новоселова:
— Последние годы я занималась изучением и анализом данных генной экспрессии, РНК-секвенирования и выявлением комбинаций биомаркеров для дифференциальной диагностики социально значимых заболеваний, в частности, онкопатологии, инфекционных заболеваний ЦНС. Были разработаны собственные методы, которые позволяют повысить ее точность.
Социально значимые заболевания, относящиеся к категории сложных, как правило, вызваны наряду с другими причинами наличием комбинации генетических изменений. Трудности изучения и лечения таких заболеваний заключаются в разнообразии проявлений, то есть фенотип заболевания может варьировать у различных пациентов. Это можно объяснить тесными взаимодействиями между различными молекулярными единицами на клеточном уровне, существованием сигнальных и функциональных биологических путей, различные нарушения в которых приводят к появлению различных проявлений.
Таким образом, при изучении сложных заболеваний необходимо концентрироваться на группах связанных между собой генов, на генных модулях. Поэтому для извлечения биомаркеров я разработала ряд методов выделения не отдельных генов или РНК, а их комбинаций, которые позволили лучше охарактеризовать произошедшее в организме изменение, улучшить качество диагностики и лечения.
Первоначально на теоретическом этапе разработанные методы тестировались на данных из открытых источников. Сегодня существует множество баз данных с генетической информацией. В качестве примера можно привести «Атлас ракового генома» (The Cancer Genome Atlas). Затем методы были апробированы на данных, которые есть в наших центрах.
Мы провели исследование групп пациентов РНПЦ детской онкологии, гематологии и иммунологии. По результатам была разработана интеллектуальная система для дифференциальной диагностики лейкозов и лимфом СППР Dif-L. Она позволила выявить комбинации биомаркеров, которые определяют именно подтипы данных заболеваний, и ее точность по сравнению с определением традиционных клинико- лабораторных и инструментальных показателей оказалась на порядок выше. Например, для В-клеточного и Т-клеточного лимфобластных лейкозов — на 10 %, а для их подтипов — примерно на 5 %.
Сегодня эта интеллектуальная система внедрена в нескольких центрах страны. Конечно, она выполняет скорее вспомогательную функцию, поскольку основное решение о постановке диагноза и назначении терапии принимает врач. Кроме того, для специалистов проводятся обучающие занятия по использованию системы.
Я активно сотрудничаю с Центром по исследованию инфекционных заболеваний им. Гельмгольца (Германия), была обладателем грантов Немецкого фонда академических обменов (DAAD), проходила стажировки. Центр имеет богатые базы данных молекулярных и генетических исследований, и я смогла многое для себя почерпнуть. Разработанные мною методы применяла для анализа данных о нарушении метаболических путей и их влиянии на развитие инфекционных заболеваний ЦНС. Как оказалось, для уточнения типа последних никогда не использовались метаболиты. Совместно с немецкими коллегами выявили, что одним из эффективных методов диагностики этих заболеваний является определение концентрации кинуренина и других метаболитов.
Еще одно направление, которым я занимаюсь, — соединение данных не из одного источника информации, а из нескольких.
В связи с тем, что различные источники биологической информации характеризуют различные изменения, происходящие в организме на клеточном уровне, в основе моих разработок лежало предположение о том, что, объединив их, можно повысить точность диагностики подтипа заболевания, надежность прогноза его развития и отклика на терапию. Кроме того, это позволяет обнаружить взаимосвязи между различными биомедицинскими сущностями (гены, белки, метаболиты и т. д.), напрямую связанными с развитием заболевания, компенсировать зашумленность и ошибки, имеющиеся в отдельных источниках данных, и тем самым получить более достоверные результаты.
Мною разработана гибридная модель классификации, которая дает возможность объединить несколько источников биологической информации о пациентах для построения классификационной модели. Последняя позволяет повысить точность диагностики подтипов сложных заболеваний, характеризующихся генетическими нарушениями. Из каждого источника выделяются признаки заболевания, являющиеся основой базовых моделей классификации, которые интегрируются в одну.
Предложенная модель была апробирована на данных онкологических заболеваний с использованием таких источников информации, как, например, данные РНК-секвенирования, микроРНК-секвенирования, профилей ДНК-метилирования о эпигенетических изменениях в геноме, данные ДНК-секвенирования, описывающие вариации на уровне ДНК, включая вставки, делеции, полиморфизм; белок-белковые взаимодействия.
Однако пока мы берем их из открытых источников, поскольку у нас в стране в настоящее время в большом объеме они накапливаются лишь в нескольких учреждениях.
Таким образом, в результате проводимых исследований по анализу комбинаций клинических, лабораторных и биомедицинских данных мы постепенно с использованием математических и статистических инструментов приходим к выявлению индивидуальных отличий в диагностике и лечении социально значимых заболеваний.
Фото автора.