Новость9516ч назад
Исследование сравнивает точность и надежность моделей Claude, Gemini и GPT при оценке риска систематической ошибки в нерандомизированных исследованиях. Результаты показали, что Gemini демонстрирует наиболее сбалансированную точность, однако на текущий момент готовые LLM не могут надежно заменять экспертов при использовании инструмента ROBINS-I.