Skala: нейронный XC‑функционал Microsoft с точностью гибридов при стоимости мета‑GGA
Что такое Skala
Skala — это нейронный обменно‑корреляционный (XC) функционал для Kohn–Sham DFT, разработанный Microsoft Research. Вместо ручной формулы XC Skala использует обучаемую нейронную модель, которая оценивается на стандартных признаках мета‑GGA на числовой интеграционной сетке и при этом сохраняет вычислительную стоимость, сопоставимую с полулокальными функционалами. В первой версии модель сознательно не обучается дисперсии; в бенчмарках применяется фиксированная коррекция D3(BJ).
Бенчмарки и точность
По стандартным термохимическим наборам данных Skala показывает конкурентоспособные результаты. Для энергий атомизации W4-17 метод демонстрирует среднюю абсолютную ошибку (MAE) примерно 1.06 kcal/mol на полном наборе и 0.85 kcal/mol на подмножестве single-reference. По GMTKN55 достигается WTMAD-2 ≈ 3.89 kcal/mol. Оценки выполнены с одинаковыми настройками дисперсии (D3(BJ) где применимо), что позволяет прямо сравнивать Skala с существующими мета‑GGA и гибридами.
Архитектура и обучение
Skala вычисляет признаки мета‑GGA на стандартной числовой сетке, затем агрегирует информацию с помощью конечного по радиусу, нелокального нейронного оператора. Дизайн учитывает важные точные ограничения, включая ограничение Lieb–Oxford, сохранение размера (size-consistency) и правильное масштабирование по координатам, а также использует ограниченный фактор улучшения (bounded enhancement factor) для устойчивости.
Обучение проводится в два этапа. Сначала модель предварительно обучается на плотностях B3LYP с метками XC, извлечёнными из высокоточных волновых энергетик. Затем осуществляется дообучение с SCF в цикле, использующее собственные плотности Skala; при этом не выполняется обратное распространение через SCF. Тренировочный корпус большой и куратированный, в нём доминируют примерно 80k высокоточных энергий атомизации (MSR-ACC/TAE) и дополнительные реакции/свойства. Публичные тестовые наборы W4-17 и GMTKN55 были исключены из обучения, чтобы избежать утечек данных.
Стоимость и реализация
Skala сохраняет полулокальное асимптотическое масштабирование затрат, примерно O(N^3) для типичных DFT-задач, и оптимизирована для исполнения на GPU через GauXC. В публичном релизе доступны реализация на PyTorch и пакет microsoft-skala на PyPI с интеграцией для PySCF и ASE, а также дополнение для GauXC для встраивания в другие DFT-стэки. В README указано около 276k параметров и приведены минимальные примеры использования. Модель и инструменты доступны в Azure AI Foundry Labs и в репозитории microsoft/skala на GitHub.
Где применять Skala
Skala рассчитана на массовую расчётную химию основных групп элементов, где важна точность гибридов, но применение гибридов или коррелированных методов на этапе скрининга слишком дорого. Типичные случаи использования: массовая оценка энергий реакций и барьеров, ранжирование конформеров и радикалов, прогнозы геометрий и диполей для задач QSAR и оптимизации лидов. Из‑за интеграции с PySCF/ASE и GPU‑пути через GauXC команды могут запускать батчевые SCF‑задачи с производительностью, близкой к мета‑GGA, оставляя гибриды и CC для финальной проверки.
Основные выводы
- Производительность: MAE ≈ 1.06 kcal/mol на W4-17 (0.85 на single-reference) и WTMAD-2 ≈ 3.89 kcal/mol на GMTKN55; дисперсия учтена через D3(BJ) в отчётах.
- Метод: нейронный XC‑функционал с входами мета‑GGA и конечнорегиональной изученной нелокальностью, соблюдающий ключевые точные ограничения и сохраняющий полулокальную стоимость.
- Обучение: обучен на большом наборе высокоточных меток, включая ~80k энергий атомизации качества CCSD(T)/CBS; дообучение с SCF использует собственные плотности Skala; тестовые наборы исключены из обучения.
Техническая статья доступна по адресу https://arxiv.org/pdf/2506.14665. Код, примеры и пакеты находятся в репозитории microsoft/skala на GitHub и на PyPI, а также в Azure AI Foundry Labs для управляемых экспериментов.