LLM

Новость4513 июн.

В статье исследуются критические уязвимости и вызовы безопасности, возникающие при использовании мультиагентных систем на основе больших языковых моделей (LLM) в различных предметных областях. Авторы выделяют семь ключевых проблем, связанных с взаимодействием агентов, которые могут привести к компрометации данных или некорректному выполнению задач при переходе между доменами. Основное внимание уделяется рискам, возникающим в процессе обмена контекстом и инструментами между специализированными агентами. Исследование подчеркивает необходимость разработки новых протоколов безопасности и методов изоляции для предотвращения несанкционированного доступа и манипуляций в сложных ИИ-экосистемах. Результаты работы имеют важное значение для разработчиков архитектур ИИ, стремящихся к созданию надежных и безопасных автономных систем. Данная работа закладывает теоретическую основу для защиты мультиагентных сред от атак типа 'prompt injection' и междоменных утечек.

безопасность ИИ LLM мультиагентные системы+2

npj Artificial Intelligence Оригинал

Новость8512 июн.

Исследователи представили PHI-Reason — инновационный фреймворк для прогнозирования взаимодействий между бактериофагами и их хозяевами (PHI) на уровне видов. В отличие от традиционных методов, использующих числовые векторы сходства последовательностей или состава геномов, PHI-Reason переформулирует задачу как процесс логического вывода на основе биологических текстов. Система преобразует гетерогенные данные (геномы фагов и хозяев, функциональные аннотации, результаты гомологического поиска и метаданные) в модульные текстовые профили. Затем замороженная большая языковая модель (LLM) ранжирует потенциальных хозяев, интегрируя эти доказательства непосредственно во время инференса. Тестирование на бенчмарках показало, что PHI-Reason демонстрирует конкурентоспособную точность и находит правильные соответствия, которые упускают классические методы. Ключевым преимуществом является интерпретируемость: метод позволяет анализировать, на каких именно биологических фактах основан прогноз, и измерять риск галлюцинаций ИИ при неполных данных. Это делает технологию важным инструментом для микробиомной инженерии и глубокого понимания микробной экологии.

микробиология LLM прогнозирование взаимодействий+2

bioRxiv — Bioinformatics Оригинал

Новость9512 июн.

В исследовании представлен CAREPath — инновационный фреймворк на базе архитектуры KG-LLM (Knowledge Graph + Large Language Model), предназначенный для поиска новых терапевтических применений существующих лекарственных средств. Авторы решают проблему неэффективности глубокого обхода биомедицинских графов знаний, когда длинные пути через «гены-хабы» создают избыточный шум. Методология сочетает в себе два подхода: DFS-подобный модуль для извлечения коротких, семантически значимых путей «болезнь-ген-препарат» и BFS-подобный модуль для обогащения контекста через соседства генов и фармакологическое сходство. В ходе экспериментов на пяти биомедицинских графах знаний CAREPath превзошел 18 базовых моделей, показав прирост метрики AUPRC до 3,8%. Результаты подтверждают, что кодирование семантических коротких путей является ключевым фактором успеха, а механизм аугментации контекста повышает устойчивость модели при дефиците данных. Практическая значимость подтверждена кейс-стади и сопоставлением с недавно одобренными FDA показаниями, что делает систему интерпретируемым инструментом для разработки новых стратегий лечения.

drug repurposing биомедицинские графы знаний LLM+3

bioRxiv — Bioinformatics Оригинал

Исследование9512 июн.

Исследование, опубликованное в Nature Machine Intelligence, рассматривает проблему гетерогенности психиатрических расстройств и сложности интерпретации неструктурированных лонгитюдных данных, что часто ведет к вариативности в клинической практике. Ученые представили специализированную большую языковую модель (LLM), разработанную именно для нужд психиатрии, которая призвана помочь врачам в стандартизации процесса диагностики и лечения. Методология исследования фокусируется на анализе текстовых нарративов пациентов, которые традиционно сложно поддаются автоматизированной обработке. Ключевым результатом является демонстрация того, что использование данной LLM позволяет снизить субъективность оценок и обеспечить более последовательное, высококачественное оказание медицинской помощи. Внедрение подобных ИИ-инструментов может значительно повысить точность интерпретации динамики состояния пациента во времени. Данная разработка имеет критическое значение для цифровой трансформации психиатрической помощи и внедрения доказательных стандартов в клиническую практику.

психиатрия LLM принятие решений+2

Nature Machine Intelligence Оригинал

Новость9512 июн.

В исследовании, опубликованном в журнале npj Digital Medicine, оценивается потенциал использования больших языковых моделей (LLM) для оптимизации процесса получения информированного согласия от пациентов в рамках клинических испытаний. Авторы анализировали способность ИИ интерпретировать сложные медицинские протоколы и преобразовывать их в доступный для пациентов формат, сохраняя при этом юридическую и клиническую точность. Методология включала сравнение ответов LLM с ответами медицинских экспертов на вопросы участников исследования. Результаты показали, что современные модели способны демонстрировать высокую степень соответствия стандартам информированного согласия, значительно сокращая время на разъяснение процедур. Применение ИИ в этом аспекте может снизить когнитивную нагрузку на пациентов и минимизировать риск ошибок при интерпретации условий участия. Данная работа подчеркивает важный шаг в автоматизации административных и коммуникационных процессов в клинической практике с помощью генеративного ИИ.

LLM клинические испытания информированное согласие+2

npj Digital Medicine Оригинал

Новость4511 июн.

В данной статье представлены результаты рандомизированного контролируемого исследования (RCT), направленного на изучение эффективности функции Guided Learning на базе модели Gemini. Исследование проводилось в Сьерра-Леоне с целью оценки того, как персонализированное ИИ-обучение влияет на вовлеченность и скорость усвоения знаний учащимися. Основной акцент сделан на потенциале использования больших языковых моделей для преодоления образовательных барьеров в развивающихся регионах. Результаты демонстрируют, что внедрение инструментов Guided Learning способствует значительному росту вовлеченности студентов в учебный процесс. Методология RCT позволяет подтвердить прямую корреляцию между использованием ИИ-ассистента и ускорением темпов обучения. Данная работа имеет важное значение для понимания того, как ИИ может масштабировать качественное образование и поддерживать когнитивное развитие в условиях ограниченных ресурсов.

образование Gemini LLM+2

DeepMind Health Оригинал

Новость9511 июн.

В статье рассматривается критическая проблема современного медицинского ИИ: разрыв между высокой производительностью моделей и их клинической обоснованностью. Авторы утверждают, что текущие методы объяснимого ИИ (XAI) и post-hoc интерпретации недостаточны для преодоления эпистемического разрыва между поведением алгоритма и обоснованными медицинскими заключениями. Вместо акцента на интерпретируемость, исследователи предлагают переход к модели управления на основе проверяемости (testability). Основные рекомендации включают проведение пререгистрированных эмпирических испытаний для проверки причинно-следственного соответствия и устойчивости моделей к изменениям оборудования (сканеров), локаций и подгрупп пациентов. Также предлагается концепция «Институционального ИИ», которая подразумевает обязательный аудит происхождения данных, проспективную валидацию, внешние проверки и использование состязательных (adversarial) методов оценки для больших языковых моделей (LLM). Данный подход направлен на минимизацию использования алгоритмами «коротких путей» (shortcuts) и обеспечение безопасности клинического применения.

регулирование клинические испытания объяснимый ИИ+3

npj Artificial Intelligence Оригинал

Новость9511 июн.

Исследование оценивает способность ведущих LLM (включая Gemini и Grok) отвечать на вопросы пациентов о заболеваниях сердца. Результаты показали высокую точность и низкий уровень галлюцинаций, при этом Gemini была признана наиболее качественной моделью по совокупности факторов.

LLM кардиология информирование пациентов+2

Frontiers in Digital Health

Новость7511 июн.

Исследование изучает использование LLM (таких как ChatGPT) среди студентов и преподавателей стоматологической школы UTHealth. Результаты показывают высокий уровень использования инструментов для обучения и письма, при этом преподаватели выражают острую потребность в специализированном обучении работе с ИИ.

образование LLM стоматология+2

Frontiers in Digital Health

Новость9511 июн.

Систематический обзор демонстрирует стремительный рост использования ИИ в обучении студентов-медиков, особенно через виртуальных пациентов на базе LLM. Основные направления включают симуляцию клинического мышления, оценку навыков OSCE и обучение работе с электронными медицинскими картами.

медицинское образование LLM симуляционное обучение+2

Frontiers in Digital Health

Новость9511 июн.

Исследование оценивает способность пяти современных языковых моделей (включая GPT-5 и GPT-4o) решать клинические задачи, связанные с лечением болей в пояснице. Авторы выявили критические ошибки в безопасности и полноте ответов, а также доказали, что структурированный промпт-инжиниринг может значительно улучшить качество медицинских рекомендаций ИИ.

LLM клиническое мышление промпт-инжиниринг+3

Frontiers in AI — Medicine

Новость9510 июн.

Исследование оценивает способность модели GPT-4o рекомендовать тип интраокулярной линзы (ИОЛ) на основе данных 74 пациентов. Результаты показали высокую точность при выборе монофокальных линз, но низкую эффективность в сложных случаях (трифокальные линзы), что указывает на необходимость дообучения модели.

диагностика офтальмология LLM+3

Frontiers in AI — Medicine

Новость9510 июн.

Исследователи представили BacteReason — специализированную большую языковую модель (LLM), предназначенную для прогнозирования чувствительности бактерий к антибиотикам с предоставлением механистического обоснования. В отличие от традиционных методов машинного обучения, которые часто работают как «черный ящик», BacteReason использует подход обучения с учителем, где проприетарная модель-наставник генерирует объяснения молекулярных механизмов резистентности. Для обеспечения научной точности модель интегрирована с биомедицинскими базами знаний через протокол TogoMCP, что позволяет привязывать каждый шаг рассуждения к конкретным доказательствам из графов знаний. В ходе тестирования на бенчмарках по экстраполяции модель показала относительное улучшение точности на 43% по сравнению с базовой ненастроенной LLM и на 38% по сравнению с моделью, прошедшей тонкую настройку без использования рациональных обоснований. Данная разработка имеет критическое значение для клинической практики, так как позволяет врачам не только получать прогноз эффективности препарата, но и понимать биологическую причину устойчивости патогена.

антимикробная резистентность LLM машинное обучение+3

bioRxiv — Bioinformatics Оригинал

Новость8510 июн.

Исследователи представили инновационный алгоритм KM-GPT-DCH, предназначенный для автоматизированного сравнения и оценки конкурирующих биомедицинских гипотез. Метод объединяет анализ совместной встречаемости терминов (co-occurrence) с возможностями больших языковых моделей (LLM) и использует байесовские методы для оценки уровня статистической уверенности. В ходе тестирования на исторических данных алгоритм продемонстрировал способность определять верную гипотезу с высокой степенью уверенности за несколько лет до того, как это было сделано научным сообществом. Авторы применили инструмент к 20 парам неразрешенных на данный момент противоречивых гипотез, предоставив вектор для будущих исследований. Практическая значимость метода заключается в возможности объективного анализа таких вопросов, как этиология депрессии (дефицит моноаминов против воспалительных процессов). Для широкого доступа реализована веб-версия алгоритма на платформе skim.morgridge.org, позволяющая визуализировать научные тренды.

LLM биоинформатика байесовский анализ+2

bioRxiv — Bioinformatics Оригинал

Новость651 июн.

На конференции SXSW26 эксперты обсудили влияние онлайн-сообществ и технологий искусственного интеллекта на путь пациента. Основное внимание было уделено взаимодействию между платформами вроде Reddit, где пациенты ищут поддержку, и развитием больших языковых моделей (LLM). Панельная дискуссия затронула критические аспекты доверия к медицинской информации в эпоху ИИ и потенциальные риски дезинформации. Участники проанализировали, как ИИ может как помогать структурировать пользовательский опыт, так и создавать новые вызовы для верификации данных. Исследование подчеркивает необходимость создания новых механизмов контроля качества контента в гибридных цифровых средах. Данная тема имеет высокую значимость для понимания будущего цифрового здравоохранения и взаимодействия врачей с пациентами через нетрадиционные каналы связи.

LLM пациентский опыт цифровое здравоохранение+2

Fierce Healthcare Оригинал

Новость951 июн.

Данное исследование, опубликованное в журнале Artificial Intelligence in Medicine, посвящено критическому анализу способности больших языковых моделей (LLM) предоставлять точную и безопасную медицинскую информацию. В центре внимания находится процесс извлечения данных, касающихся специфических аспектов эпидуральной анестезии, что является критически важным для клинической практики. Авторы проводят сравнительный анализ различных архитектур моделей, проверяя их на предмет галлюцинаций, фактических ошибок и соответствия доказательной медицине. Методология включает оценку точности ответов на сложные клинические вопросы, где цена ошибки крайне высока. Результаты исследования ставят под сомнение прямую корреляцию между количеством параметров модели и качеством её медицинских ответов, указывая на то, что более компактные, но специализированные модели могут демонстрировать сопоставимую или даже превосходящую надежность. Работа подчеркивает необходимость внедрения строгих протоколов верификации для использования LLM в качестве инструментов поддержки принятия врачебных решений.

LLM клиническая практика информационный поиск+2

Artificial Intelligence in Medicine Оригинал

Новость9531 мая

Исследование посвящено оценке способности новейшей мультимодальной большой языковой модели ChatGPT-5 предоставлять точную и полезную информацию по чувствительной урологической теме — вазэктомии. Методология включала анализ 10 наиболее популярных запросов из Google Trends, на которые модель давала ответы, оцениваемые панелью из восьми экспертов (урологов, специалистов по общественному здравоохранению, акушера-гинеколога и медсестры по репродуктивному здоровью). Эксперты оценивали ответы по шести критериям, включая медицинскую точность, полноту и ясность, по 5-балльной шкале Лайкерта. Результаты показали средние баллы в диапазоне от 3.75 до 4.04, при этом наиболее высокие оценки получили ясность языка и уместность тона. Однако была выявлена значительная вариативность в оценках медицинской точности и полноты данных, а коэффициент внутриклассовой корреляции (ICC) составил -0.01, что указывает на крайне низкую согласованность между экспертами. Авторы делают вывод, что, несмотря на высокую доступность и понятность ответов, использование LLM в качестве образовательного ресурса требует строгого экспертного контроля и адаптации под целевую аудиторию.

ChatGPT-5 LLM урология+3

Frontiers in Digital Health

Новость9524 мая

В данной статье рассматриваются сложные вопросы регулирования медицинского искусственного интеллекта на базе больших языковых моделей (LLM) в США. Основное внимание уделяется вызовам, которые LLM создают для традиционных регуляторных механизмов, поскольку их применение часто выходит за рамки стандартных определений медицинских изделий. В центре обсуждения — интервью с доктором Шантану Нунди, советником офиса Комиссара FDA по вопросам управления ИИ и политики в области цифрового здравоохранения. Исследование подчеркивает необходимость адаптации нормативной базы для охвата новых типов ИИ-инструментов, которые могут использоваться не только для диагностики, но и для поддержки принятия клинических решений и взаимодействия с пациентами. Эксперт анализирует, как FDA планирует балансировать между стимулированием инноваций и обеспечением безопасности пациентов в условиях быстрого развития генеративного ИИ. Работа представляет высокую значимость для понимания будущего правового поля в цифровой медицине.

регулирование LLM FDA+2

npj Digital Medicine Оригинал

Новость9523 мая

В данной статье рассматриваются критические аспекты регулирования и надзора за медицинскими устройствами, использующими генеративный ИИ (GenAI) и большие языковые модели (LLM). В рамках интервью с доктором Шантану Нунди, советником офиса комиссара FDA по вопросам управления ИИ и цифровой политики здравоохранения, анализируется сложность контроля за новыми технологиями. Основная идея заключается в том, что надзор за GenAI выходит за рамки полномочий одного регулятора и требует тесной координации между государственными агентствами, системами здравоохранения и практикующими клиницистами. Статья подчеркивает необходимость создания комплексной экосистемы управления для обеспечения безопасности и эффективности ИИ-решений. Кроме того, эксперт дает практические рекомендации для разработчиков и инноваторов по продуктивному взаимодействию с FDA. Работа представляет высокую ценность для понимания регуляторного ландшафта в эпоху стремительного развития медицинских нейросетей.

регулирование генеративный ИИ LLM+3

npj Digital Medicine Оригинал

Медицинский визуальный вопрос-ответ с использованием мультимодальных моделей: систематический мини-обзор (2023–2026)

Семь проблем безопасности в кросс-доменных мультиагентных системах на базе LLM

PHI-Reason: прогнозирование взаимодействия фагов и хозяев на уровне видов на основе структурированных профилей биологических текстов

CAREPath: Семантическое контекстно-зависимое рассуждение по путям с использованием эмбеддингов, дополненных механизмами, для перепрофилирования лекарств

На пути к принятию решений в психиатрии с помощью ИИ

Эффективность большой языковой модели в процессе получения информированного согласия для участия в клиническом исследовании

Измерение влияния обучения с использованием ИИ в Сьерра-Леоне и за её пределами

Доказательства важнее объяснений: подвергните медицинский ИИ испытаниям

Эффективность больших языковых моделей в предоставлении точной и понятной информации пациентам о сердечной недостаточности и кардиомиопатии

Искусственный интеллект в учебных программах по клиническим навыкам в медицинском образовании: обзор внедрений с 2022 года

Недостатки клинического мышления LLM при лечении болей в пояснице и их устранение с помощью промпт-инжиниринга: от оценки эффективности до диагностики ошибок

Оценка GPT-4o в принятии решений при хирургии катаракты: уместность, последовательность и клинические последствия

BacteReason: Модель рассуждения для прогнозирования антимикробной резистентности

Количественная оценка доказательств для конкурирующих биомедицинских гипотез с использованием больших языковых моделей и байесовского анализа

SXSW26: Роль Reddit и больших языковых моделей (LLM) в процессе лечения пациентов

Размер не имеет значения: Оценка надежности больших языковых моделей в медицинском контексте: фокус на поиске информации об эпидуральной анестезии

Может ли ChatGPT-5 обучать население вопросам вазэктомии?: оценка экспертной группы на основе данных Google Trends

Экспертные мнения о подходах США к регулированию больших языковых моделей в здравоохранении

Экспертные мнения об экосистеме надзора за медицинским ИИ в эпоху генеративного ИИ