Исследователи представили ToxCastLite — инновационную систему для портативного анализа данных вычислительной токсикологии, решающую проблему огромного объема базы данных ToxCast (около 100 ГБ). Система объединяет облегченные профили SQLite с семантическим RDF-слоем, что позволяет сократить объем данных до 3 ГБ при сохранении возможности глубокого анализа. Методология включает интеграцию данных о биоактивности in vitro, токсичности in vivo (из ToxRefDB) и контекста использования химикатов (из CPDat) через единые идентификаторы DSSTox. Ключевой особенностью является использование прототипа на Streamlit с локальной большой языковой моделью (LLM), которая преобразует естественные вопросы пользователей в SPARQL-запросы, минимизируя риск галлюцинаций благодаря версионной схеме RDF. В ходе тестирования на кейсах нейротоксичности развития (DNT) система успешно выявила соответствия между результатами in vitro и данными in vivo, а также помогла приоритизировать химические вещества на пересечении сигналов NAM, доказательств ToxRefDB и данных о продуктах. Это решение значительно упрощает кросс-доменный поиск доказательств для экспертов, позволяя переходить от семантических запросов к детальным кривым «концентрация-ответ» без написания сложного кода.