Исследование сравнивает федеративное обучение с централизованным для классификации доброкачественных и злокачественных поражений в маммографии на двух гетерогенных датасетах (плёночные и цифровые снимки). Результаты показывают, что федеративное обучение работает надёжно в однородных условиях, но демонстрирует снижение производительности при сильном сдвиге доменов между плёночными и цифровыми изображениями.
Представлен CoLa-VAE — новый глубокий генеративный фреймворк на основе вариационного автокодировщика (VAE), который явно интегрирует ограничения межклеточной коммуникации (CCC) в обучение латентных переменных. В отличие от существующих подходов, моделирующих клеточное состояние исключительно через внутреннюю экспрессию генов, метод использует динамическую регуляризацию графового лапласиана, полученную из парных взаимодействий лиганд-рецептор. Это позволяет разделить коммуникативную топологию от транскрипционной гетерогенности в рамках единой архитектуры. Исследователи продемонстрировали, что CoLa-VAE работает как метод-агностичный фреймворк, совместимый с различными определениями сигнальных путей. Метод последовательно превосходит современные аналоги в метриках структурной кластеризации и точности шумоподавления на гетерогенных платформах секвенирования. Применение метода позволяет более точно анализировать клеточные взаимодействия, что критически важно для понимания механизмов развития заболеваний, разработки таргетных терапий и персонализированной медицины. Технология может быть использована при исследовании опухолевой микроокружения, иммунных ответов и регенеративных процессов.
Исследование представляет разработку новой перенастраиваемой вычислительной модели BlueSTARR для предсказания регуляторных эффектов некодирующих генетических вариантов, которые сложно интерпретировать только по последовательности ДНК. Авторы обучали несколько глубоких нейросетевых моделей на данных целогеномных STARR-seq анализов из двух клеточных линий и одного режима лекарственного воздействия. Исследование выявило глобальный сигнатурный паттерн по всему геному человека, соответствующий очищающему отбору против вариантов как с потерей, так и с приобретением регуляторной функции, при этом обнаружена значительная тенденция к отбору против усиления функции цис-регуляторных элементов в закрытом хроматине. При тестировании на синтетических энхансерах с мотивами связывания транскрипционных факторов GR и AP-1 модель показала способность обучаться дистанционно-зависимым и зависящим от лечения паттернам связывания и активации репортерных генов. Результаты демонстрируют, что легкие, легко перенастраиваемые модели эффективны для выявления скрытых сигналов в новых экспериментальных данных. Авторы отмечают лишь умеренные различия в производительности между различными архитектурами глубокого обучения при обучении на одном типе данных, при этом даже для промышленных моделей остается значительный запас для улучшений.
Исследователи разработали новый AI-фреймворк OPTIMIS для решения проблемы управления сложными биологическими системами на разных масштабах. Методология объединяет дискретный стохастический алгоритм Гиллеспи для микромасштабной динамики рецепторов с непрерывными нелинейными дифференциальными уравнениями для макромасштабного поведения организма. Для достижения скорости, необходимой для глубокого обучения с подкреплением (RL), гибридная система сжимается в дифференцируемый суррогат Neural ODE, действующий как быстрый цифровой двойник. В качестве демонстрации концепции фреймворк применён к инженерной клеточной терапии, где агенты RL обучаются динамическим закрытым петлям лечения внутри суррогатной среды. Ключевой результат: отслеживание микроскопической непредсказуемой клеточной активности как раннего предупреждающего сигнала позволило ИИ непрерывно корректировать дозу препарата, предвосхищая и останавливая опасные иммунные реакции до их неконтролируемого развития. Вычислительное усовершенствование улучшило показатели успешного контроля до более чем 70% в высоко нестабильных симулированных фенотипах, что представляет собой значимый прорыв для персонализированной медицины. Практическая значимость: метод предоставляет общий фреймворк для адаптивного вмешательства в многомасштабные биологические системы, открывая путь к автоматизированному принятию клинических решений в реальном времени.
Исследование представляет метод CoMPLip (co-folding of membrane proteins and lipid molecules), который улучшает точность предсказания структуры мембранных белков с помощью глубокого обучения. Традиционные подходы к предсказанию структуры белков, включая AlphaFold 3, не учитывают явным образом молекулярное окружение, что особенно критично для мембранных белков, чья структура и взаимодействия сильно зависят от липидного окружения. CoMPLip решает эту проблему путём совместного фолдинга белков с липидными молекулами во время предсказания, заставляя липиды организовываться в бислои вокруг трансмембранных регионов, создавая реалистичную мембранную среду. Метод демонстрирует улучшения в предсказании позы лигандов, корректном разделении внеклеточных и внутриклеточных доменов, а также позволяет исследовать множественные конформационные состояния динамических транспортеров. Ключевое преимущество CoMPLip — обучение не требуется (training-free), что упрощает интеграцию в существующие рабочие процессы AlphaFold 3. Это имеет прямое значение для разработки лекарств, так как мембранные белки составляют около 60% всех мишеней для фармакологических препаратов, и точное понимание их структуры критично для дизайна эффективных терапевтических агентов.
Представлен MEIsensor — фреймворк глубокого обучения для обнаружения и классификации вставок мобильных элементов (MEI) в человеческом геноме на основе данных секвенирования длинными ридами. В отличие от традиционных подходов, опирающихся на выравнивание с библиотекой повторов, MEIsensor выполняет прямую аннотацию на основе последовательности для вставок Alu, LINE1 и SVA. Оценка на бенчмарках HGSVC с использованием HiFi-длинных ридов показала, что MEIsensor превосходит существующие инструменты по основным классам MEI при существенном улучшении вычислительной эффективности, особенно для структурно сложных вставок SVA. Ручная верификация подтвердила способность метода идентифицировать MEI в высокоповторяющихся геномных регионах, включая центромерные повторы высшего порядка, которые ранее отсутствовали в бенчмарк-наборах. Это исследование представляет собой важный шаг в развитии вычислительной геномики, где методы глубокого обучения позволяют преодолеть ограничения традиционных алгоритмов выравнивания. Инструмент может быть полезен для исследований наследственных заболеваний, связанных со структурными вариациями генома, и для персонализированной медицины. Однако в тексте не указаны конкретные числовые метрики точности или скорости, что ограничивает оценку практической значимости.
В статье представлен новый фреймворк для анализа интерпретируемости моделей глубокого обучения, основанный на формальном понятии семантики модели из философии науки. Авторы аргументируют, что интерпретируемость является лишь одним из аспектов семантики модели, а не её полным описанием. Исследование иллюстрирует предложенный фреймворк примерами из биомедицинской области, демонстрируя практическую применимость подхода. Работа подчеркивает критическую важность понимания не только того, как работают медицинские ИИ-модели, но и того, что именно они представляют в семантическом смысле. Это особенно актуально для клинической практики, где врачи должны доверять рекомендациям алгоритмов. Фреймворк позволяет систематически анализировать неявные семантические аспекты моделей, которые часто остаются скрытыми при стандартной интерпретации. Статья опубликована в Nature Machine Intelligence, что указывает на высокую научную значимость работы. Подход может способствовать более надежному внедрению ИИ в медицинские приложения за счет улучшения прозрачности и доверия к алгоритмам.
Исследователи представили RNASTOP — новую вычислительную платформу, сочетающую глубокое обучение с эвристическим поиском для одновременного предсказания и оптимизации химической стабильности молекул мРНК. Проблема химической нестабильности мРНК ограничивает долгосрочную эффективность мРНК-вакцин, и существующие методы предсказания деградации имеют ограниченную точность. RNASTOP демонстрирует улучшение точности на 13% по сравнению с лучшей моделью в конкурсе Stanford OpenVaccine и показывает устойчивую обобщаемость при предсказании деградации полноразмерных последовательностей мРНК. При применении к оптимизации кодонов мРНК для вакцины против вируса ветряной оспы (Varicella-Zoster Virus) система снизила минимальную свободную энергию на 75,73% при сохранении высокой эффективности трансляции. Разработанная модель представляет собой мощный инструмент для ускорения разработки мРНК-терапевтических средств, что особенно актуально в контексте пандемии COVID-19 и создания вакцин нового поколения. Исследование открывает перспективы для рационального дизайна мРНК-препаратов с улучшенной стабильностью и эффективностью. Исходный код проекта доступен в открытом доступе на GitHub.
Исследователи представили miRBind2 — метод глубокого обучения для предсказания сайтов связывания микроРНК (миРНК) исключительно на основе последовательности. МиРНК регулируют экспрессию генов, направляя белки Argonaute к частично комплементарным участкам целевых РНК. В отличие от классических методов, использующих инженерные признаки (категории seed-соответствия, эволюционная консервация), miRBind2 применяет свёрточную нейронную сеть (CNN) с новой попарной нуклеотидной репрезентацией, охватывающей все возможные взаимодействия между миРНК и мишенью. Модель продемонстрировала превосходство над предыдущими методами SotA на четырёх независимых наборах данных из benchmark debiased miRBench, при этом используя на 92% меньше параметров. Архитектура была расширена до модели miRBind2-3UTR для предсказания репрессии генов на уровне транскриптов путём дообучения на экспериментах по пертурбации миРНК. На датасете из 50,549 пар миРНК-ген модель miRBind2-3UTR значительно превзошла TargetScan. Результаты показывают, что предобученные глубокие модели способны улавливать регуляторные сигналы и предсказывать функциональную репрессию без традиционных инженерных биологических признаков.
Данная статья представляет систематический обзор современных методов машинного и глубокого обучения, применяемых для диагностики острого лимфобластного лейкоза (ALL) — наиболее распространённого вида рака у детей. Авторы проанализировали исследования, использующие различные алгоритмы ИИ для анализа медицинских изображений, лабораторных данных и геномной информации с целью выявления заболевания на ранних стадиях. Обзор охватывает применение сверточных нейронных сетей для анализа микроскопических изображений клеток крови, методов обработки естественного языка для извлечения информации из электронных медицинских карт, а также ансамблевых алгоритмов для прогнозирования риска развития лейкоза. Ключевые результаты показывают, что ИИ-модели демонстрируют точность диагностики от 85% до 97% в зависимости от типа входных данных и архитектуры алгоритма. Исследование подчёркивает важность валидации моделей на разнообразных популяциях пациентов и стандартизации протоколов сбора данных. Работа имеет значимость для клинической практики, так как автоматизированные системы диагностики могут сократить время постановки диагноза, снизить субъективность оценки и улучшить выживаемость пациентов за счёт раннего выявления заболевания.
Исследование предлагает текстово-ориентированный фреймворк, использующий NLP-трансформер для генерации структурированных описаний из панорамных рентгенограмм с последующей классификацией заболеваний. Модель 1D-CNN показала наивысшую точность (84%), а оба текстовых подхода превзошли традиционные CNN, обученные непосредственно на изображениях.
Исследование представляет автоматизированный пайплайн на основе глубокого обучения (UNet) и радиомикой для сегментации и классификации опухолей молочной железы по ультразвуковым снимкам. Система достигает точности классификации 97,8% и среднего IoU 0,94231, что демонстрирует потенциал для снижения участия человека в диагностическом процессе.
Исследование применяет методы трансферного обучения (VGG16, VGG19, ResNet) для классификации типов рака на основе данных RNA-Seq экспрессии генов. VGG16 показал наилучшие результаты с точностью 95%, что демонстрирует эффективность глубокого обучения для медицинской диагностики.
Предложена объяснимая многомодальная система глубокого обучения для диагностики рака, объединяющая радиологические изображения и клинические данные с использованием внимания. Модель показала превосходство над одно-модальными подходами на наборах данных CBIS-DDSM, Duke Breast Cancer MRI и TCGA, обеспечив баланс между чувствительностью и специфичностью без потери точности.
Обзорный анализ применения искусственного интеллекта для ультразвуковой навигации при инъекциях в плечевой сустав. Исследование охватывает технологии сегментации анатомических структур, алгоритмы глубокого обучения и их влияние на точность процедур и клинические исходы. Результаты подтверждают улучшение показателей успешности инъекций и качества лечения пациентов.
Разработан алгоритм TRI_IF на основе глубокого обучения (архитектура Xception) и морфометрического анализа для автоматической количественной оценки интерстициального фиброза почки на гистологических слайдах без ручных аннотаций. Модель продемонстрировала высокую согласованность с оценками нефропатологов (R2=0.86-0.93, Cohen's kappa=0.86-0.91) и точно предсказывала клинические исходы (ЭСКП, снижение СКФ). Подход обеспечивает масштабируемое решение для клинической практики и исследований в нефропатологии.
Исследование с использованием глубокого обучения (ConvNeXt) показало, что диагностическая информация в гистологических изображениях H&E содержится преимущественно в структурных особенностях (оттенки серого), а не в цветовой информации. Модели ИИ могут эффективно работать без цветовой информации, что ставит под сомнение важность цветовой нормализации в диагностических алгоритмах.
Исследование применяет ансамбль U-Net для автоматической сегментации коллагена на гистологических срезах печени с оценкой неопределённости предсказаний. Анализ 686 биопсий из 20+ клиник показал высокую точность сегментации (Dice 0.83–0.90) и продемонстрировал, что оценка неопределённости помогает выявлять некачественные изображения и артефакты.