В данном исследовании представлен новый унифицированный бенчмарк BGCs-Bench, предназначенный для оценки эффективности геномных языковых моделей (gLM) с поддержкой длинного контекста. Основное внимание уделено анализу биосинтетических генных кластеров (BGC) через решение трех ключевых задач: предсказание биосинтетического класса, таксономическая классификация и аннотация кодирующих последовательностей. Авторы провели систематическую послойную оценку эмбеддингов, доказав, что выбор конкретных слоев модели критически влияет на точность выполнения прикладных задач. С помощью анализа logit lens для авторегрессионных моделей на базе архитектуры StripedHyena было выявлено, что ранние слои отвечают за кодирование биологически значимой информации из последовательностей ДНК, в то время как глубокие слои оптимизированы для генерации последовательностей. Результаты работы предоставляют методологическую базу для более эффективной разработки и применения специализированных ИИ-моделей в геномике и синтетической биологии.