Gate News сообщает, 17 марта, Mistral AI сегодня выпустила Leanstral — первый открытый агент с исходным кодом, специально разработанный для инструмента формальной верификации Lean 4. Основная инновация модели заключается в том, что она может одновременно генерировать код и выводить формальные доказательства, которые автоматически проверяются Lean 4, тем самым обходя узкое место традиционной ручной проверки при генерации кода AI.
Leanstral использует разреженную архитектуру MoE, обладает 120 миллиардов параметров и 6 миллиардами активных параметров, распространяется под лицензией Apache 2.0 и прошла специальную тренировку и оптимизацию для lean-lsp-mcp. Пользователи могут запускать её в Mistral Vibe с помощью команды /leanstall без настройки или вызывать через бесплатный API-эндпоинт labs-leanstral-2603, а также поддерживается загрузка весов для самостоятельного развертывания.
Mistral одновременно выпустила новый бенчмарк оценки FLTEval, в качестве тестовой сцены использовался проект по формализации Великой теоремы Ферма в сообществе Lean 4. Данные о производительности показывают: Leanstral pass@2 за 36 долларов достигает оценки 26.3, что превышает результат Claude Sonnet 4.6 за 549 долларов с 23.7 балла; pass@16 за 290 долларов показывает 31.9 балла, опережая Sonnet на 8 баллов, тогда как Claude Opus 4.6 требует 1650 долларов для достижения 39.6 баллов. Среди открытых моделей Qwen3.5-397B-A17B нужно выполнить 4 раза, чтобы достичь 25.4 балла, что всё ещё ниже, чем результат Leanstral pass@2.