валидация моделей

Новость9521 маяОбзор

Исследование посвящено критической проблеме воспроизводимости фенотипов изображений, извлеченных из МРТ головного мозга с помощью методов глубокого обучения без учителя (unsupervised deep learning). Авторы проверяли стабильность полученных признаков при различных условиях: изменении случайных seed-параметров, разделении данных при кросс-валидации и использовании независимых когорт (UK Biobank и ADNI). В работе сравнивались архитектуры сверточных нейросетей (CNN) и трансформеров (ViT). Результаты показали высокую стабильность представлений ViT: средний показатель CKA составил 0.74 против 0.27 у случайных моделей, а KCCA — 0.84 против 0.60. Важным достижением стало подтверждение биологической значимости: коэффициент перекрытия генетических локусов (loci overlap ratio) для ViT составил 0.45, что значительно выше 0.08 у необученных моделей (p < 0.001). Исследование доказывает, что такие фенотипы (UDIPs) надежно отражают биологическую структуру мозга, а не артефакты обучения, что делает их перспективным инструментом для исследований в области нейрогенетики.

нейровизуализация глубокое обучение МРТ генетика трансформеры валидация моделей

bioRxiv — Bioinformatics Оригинал

Новость9519 мая

Исследование посвящено решению критической проблемы клинической генетики — интерпретации миссенс-вариантов неопределенного значения (VUS). Авторы представляют новый количественный показатель — среднюю силу доказательств (mean evidence strength, MES), который позволяет оценивать вычислительные предикторы эффекта вариантов (VEP) и мультиплексные анализы (MAVE) в соответствии с руководствами ACMG/AMP. В ходе работы с использованием фреймворка acmgscaler было проведено калибрование 12 популяционных VEP для 367 генов заболеваний и проанализировано 15 наборов данных MAVE. Результаты показали, что традиционная метрика AUROC не всегда коррелирует с реальной клинической ценностью: MAVE продемонстрировали высокий средний показатель MES, несмотря на более низкий AUROC по сравнению с некоторыми VEP. В частности, предиктор CPT-1 показал наивысший MES и обеспечил наиболее значительный объем калиброванных доказательств для наибольшей доли VUS из базы ClinVar. Предложенный фреймворк MES предоставляет практический инструмент для оценки того, насколько эффективно ИИ-модели и экспериментальные данные могут использоваться для принятия клинических решений.

генетика клиническая диагностика машинное обучение+2

bioRxiv — Bioinformatics Оригинал

Новость7515 мая

Исследование анализирует риски систематических ошибок при создании моделей ИИ для онлайн-диагностики симптомов из-за самоотбора участников. Авторы выявили, что способы привлечения пользователей и процент прохождения повторных опросов существенно влияют на репрезентативность данных, что критично для обучения точных медицинских алгоритмов.

онлайн-диагностика валидация моделей предвзятость данных+2

Frontiers in AI — Medicine

Новость7515 мая

Исследование посвящено критической проблеме разработки малых интерферирующих РНК (siRNA) для таргетной терапии: риску побочных эффектов и нестабильности РНК. Авторы выявили системную ошибку в существующих in silico моделях — утечку данных (data leakage) при перекрестной проверке, что приводит к искусственному завышению точности прогнозов. В работе предложен новый строгий фреймворк, использующий z-кривые (3D-представление физико-химических свойств РНК) для контекстно-зависимого кодирования последовательностей. Разработанная модель достигла показателя AUC 0.845 на валидации без утечки данных, при этом скорость вычислений оказалась в 380 раз выше, чем у предыдущих решений. Исследование доказывает, что качество представления данных важнее сложности самой модели. Результаты работы создают фундамент для создания надежных и проверяемых методов дизайна последовательностей в области РНК-терапии.

RNA-терапия машинное обучение биоинформатика+2

bioRxiv — Bioinformatics Оригинал

валидация моделей

Воспроизводимость фенотипов изображений, полученных с помощью обучения глубоких нейросетей без учителя

Клиническая доказательная база как фреймворк для оценки вычислительных предикторов и мультиплексных анализов эффекта вариантов

Отсев и репрезентативность при разработке и валидации онлайн-сервисов проверки симптомов — тематическое исследование опросника Rheumatic?

Бенчмаркинг предсказания siRNA: роль представления данных и стратегий валидации