Gate News сообщение, 24 апреля — DeepSeek V4 опубликовала результаты оценок формального математического рассуждения, набрав идеальные 120/120 на Putnam-2025, разделив первое место с Axiom.

В практическом режиме с использованием LeanExplore и ограниченной выборки V4-Flash-Max набрала 81.00 по бенчмарку Putnam-200 Pass@8, значительно обойдя Seed-2.0-Prover (35.50), Gemini 3 Pro (26.50) и Seed-1.5-Prover (26.50). Результаты в режиме frontier показали, что V4 опережает Seed-1.5-Prover (110/120) и Aristotle (100/120).

V4 использует гибридный подход к формально-неформальным рассуждениям: неформальные рассуждения генерируют кандидаты решений на естественном языке, самопроверка отфильтровывает результаты, а формальный агент завершает строгие доказательства в Lean. Результаты в режиме frontier использовали масштабирование вычислений в больших объемах, тогда как оценки в практическом режиме лучше отражают возможности стандартного развертывания.

Посмотреть источник

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Cursor раскрывает причину обучения XAI: вычислительные мощности были заблокированы, SpaceX также держит 60 млрд долларов в виде опционов на приобретение

Новости индустрии ИИ

Анонс Anysphere сообщает, что Cursor будет использовать инфраструктуру Colossus компании xAI для обучения новой модели, чтобы преодолеть узкое место по вычислительным мощностям; SpaceX предложила опцион на приобретение на 60 млрд долларов (в течение 2026 года можно приобрести целиком), а если нет — выплатить около 10 млрд долларов в качестве компенсации за сотрудничество. Обе сделки идут одновременно, меняя то, кто сможет обучать Cursor, и то, кто сможет купить Cursor; при этом Cursor по-прежнему позволяет множество моделей использовать в качестве бэкенда, но в долгосрочной перспективе это зависит от того, воспользуется ли SpaceX правом на приобретение.

ChainNewsAbmedia14м назад

Оценка вторичного рынка Anthropic превысила 1 трлн долларов: Forge Global обошла OpenAI на 880 млрд

Новости индустрии ИИ

Согласно сообщению Decrypt, вторичная оценка Forge Global для Anthropic составляет около 1 трлн долларов, для OpenAI — около 8 800 млрд долларов; на вторичном рынке впервые наблюдается лидирующий разворот. ARR Anthropic вырос с примерно 9 млрд на конец 2025 года до примерно 30 млрд в марте 2026 года: рост за три месяца составил 233%, что подтолкнуло оценку в частном секторе. Вторичная оценка отличается от первичного раунда финансирования и отражает уверенность в выходе; в дальнейшем по-прежнему смотрят на четыре направления — технологии, политику, бизнес и нарратив.

ChainNewsAbmedia15м назад

Meta Platforms Планирует Сокращение Штата На 10% 20 Мая, Затронув Примерно 8 000 Должностей

Новости индустрии ИИ

Сообщение Gate News, 24 апреля — Meta Platforms планирует сократить штат примерно на 10%, затронув около 8 000 должностей, 20 мая. Увольнения предназначены для повышения операционной эффективности при одновременном увеличении инвестиций в искусственный интеллект. Запланированная реорганизация отражает то, что

GateNews1ч назад

Правительство Трампа объявило план по борьбе с AI-экстракцией и переработкой, обвиняя китайские компании в систематическом похищении возможностей моделей

Новости индустрии ИИ

Официальный помощник президента Управления по научно-технической политике Белого дома (OSTP) Майкл Дж. Крацйос (Michael J. Kratsios) 23 апреля сделал официальное заявление, в котором указал, что администрация Трампа располагает информацией, свидетельствующей о том, что иностранные структуры (в основном расположенные в Китае) намеренно нацелены на крупные американские компании в сфере искусственного интеллекта, систематически извлекают возможности американских AI-моделей с помощью «десятков тысяч прокси-аккаунтов» и систем взлома (jailbreak), а также одновременно объявили о четырех мерах реагирования.

MarketWhisper1ч назад

DeepSeek выпускает V4 open-source preview, технический рейтинг 3206 превзошёл GPT-5.4

Новости индустрии ИИ

DeepSeek 24 апреля официально запустила серию предварительных версий V4, выпущенную с открытым исходным кодом по лицензии MIT; веса модели также были одновременно размещены на Hugging Face и ModelScope. Согласно техническому отчету DeepSeek V4, V4-Pro-Max (режим с максимальной вычислительной/инференс-усиленной мощностью) набрала 3206 баллов на бенчмарке Codeforces, превзойдя GPT-5.4.

MarketWhisper1ч назад

Cambricon завершает адаптацию Day 0 DeepSeek-V4, отмечая веху для экосистемы ИИ-чипов в Китае

Новости индустрии ИИ

Сообщение Gate News, 24 апреля — сегодня Cambricon объявила о завершении адаптации Day 0 для DeepSeek-V4, новейшей крупной языковой модели от DeepSeek, с использованием ее собственной программной экосистемы NeuWare и фреймворка vLLM. Код адаптации был одновременно опубликован с открытым исходным кодом, отмечая

GateNews2ч назад

комментарий

0/400

Нет комментариев