В статье представлен EPPCMinerBen — инновационный набор метрик и стандартов (бенчмарк), разработанный специально для тестирования возможностей больших языковых моделей (LLM) в контексте цифрового взаимодействия пациентов и медицинских работников. Исследование фокусируется на анализе коммуникации, происходящей через порталы пациентов, что является критически важным аспектом современной телемедицины. Авторы предлагают методологию оценки того, насколько точно ИИ может интерпретировать запросы пациентов и генерировать адекватные, клинически безопасные ответы. В работе подчеркивается необходимость создания специализированных инструментов оценки, так как стандартные NLP-метрики не учитывают специфику медицинского контекста и этические аспекты общения. Использование данного бенчмарка позволит разработчикам ИИ-решений минимизировать риски неверной интерпретации симптомов и повысить качество автоматизированной поддержки в здравоохранении. Результаты исследования закладывают фундамент для внедрения более надежных LLM-ассистентов в клиническую практику через электронные медицинские системы.