клиническая методология

Новость9515 мая

Исследование сравнивает точность и надежность моделей Claude, Gemini и GPT при оценке риска систематической ошибки в нерандомизированных исследованиях. Результаты показали, что Gemini демонстрирует наиболее сбалансированную точность, однако на текущий момент готовые LLM не могут надежно заменять экспертов при использовании инструмента ROBINS-I.

LLM клиническая методология анализ данных валидация ИИ

BMJ Digital Health & AI

клиническая методология

Сравнение способности трех больших языковых моделей оценивать риск систематической ошибки с помощью инструмента ROBINS-I