В статье представлено обновление программного обеспечения Harmony2, предназначенного для интеграции профилей секвенирования РНК единичных клеток (scRNA-seq). В условиях стремительного роста биомедицинских данных, объем которых в открытом доступе уже превышает 100 миллионов клеток, традиционные методы сталкиваются с проблемой масштабируемости. Разработчики представили алгоритм, способный эффективно обрабатывать более 100 миллионов клеток и более 1000 наборов данных без необходимости использования специализированного высокопроизводительного оборудования. Ключевым технологическим достижением является оптимизация базового алгоритма, которая предотвращает эффект «переинтеграции» (overintegration), сохраняя биологическую гетерогенность в сложных наборах данных. Это позволяет создавать высокоточные атласы единичных клеток, что критически важно для понимания клеточной архитектуры различных тканей и органов. Инструмент представляет высокую ценность для биоинформатиков и исследователей, занимающихся системной биологией и персонализированной медициной.