Gemini 3.1 Pro представлен: от абстрактного мышления до соревновательного уровня программирования, Google вновь устанавливает новые стандарты для передового ИИ

ChainNewsAbmedia

Когда соревнования крупных языковых моделей перешли от «кто отвечает быстрее» к «кто думает глубже», Google вновь представила новое поколение ключевого оружия. 19 февраля Google официально анонсировала Gemini 3.1 Pro — это не только обновление версии серии Gemini 3, но и всестороннее повышение уровня для высокоуровневых способностей рассуждения. В официальных заявлениях прямо указано, что 3.1 Pro создан специально для «сложных задач без стандартных ответов», с целью применения в научных исследованиях, инженерной разработке и сценариях долгосрочного принятия решений.

Исходя из опубликованных данных тестов, это обновление не является пустой болтовней, а демонстрирует прорывные достижения в нескольких сложных оценках.

Ключевое обновление для сложных задач

В своем заявлении Google позиционирует Gemini 3.1 Pro как «более умную и способную базовую модель», подчеркивая её прогресс в основных возможностях рассуждения. Эта модель продолжает исследования, начатые в Gemini 3 Deep Think, дополнительно укрепляя базовую интеллектуальную составляющую, что позволяет ей лучше справляться с многошаговым логическим рассуждением, абстрактным мышлением и разбором профессиональных задач.

По сравнению с Gemini 3 Pro, выпущенной в ноябре 2025 года, 3.1 Pro — это не просто оптимизация производительности, а структурный рост в области рассуждения.

ARC-AGI-2 достиг 77,1%: удвоение абстрактных рассуждений

Самым заметным результатом является показатель ARC-AGI-2, считающийся одним из высших индикаторов AI-рассуждения. Этот тест специально оценивает способность модели решать «новые логические модели», избегая зависимости от уже известных знаний.

По открытым данным:

Gemini 3.1 Pro: 77,1% (подтверждено ARC Prize)

Gemini 3 Pro: 31,1%

Sonnet 4.6: 58,3%

Opus 4.6: 68,8%

GPT-5.2: 52,9%

По сравнению с предыдущим результатом 31,1%, показатель 3.1 Pro почти удвоился. Это означает, что модель стала значительно лучше в абстрактном рассуждении и выявлении паттернов при столкновении с неизвестными задачами.

Совмещение профессиональных знаний и научных рассуждений

В оценке научных знаний GPQA Diamond Gemini 3.1 Pro набрала 94,3%, что выше GPT-5.2 (92,4%), Opus 4.6 (91,3%) и Sonnet 4.6 (89,9%).

Это показывает, что 3.1 Pro не только умеет работать с абстрактной логикой, но и поддерживает высокий уровень интеграции профессиональных знаний и научных рассуждений.

Значительный прогресс в программных возможностях: соревнования на высшем уровне

В тестах программирования и агентских задачах Gemini 3.1 Pro также показывает впечатляющие результаты.

LiveCodeBench Pro: Elo 2887 (GPT-5.2 — 2393, Gemini 3 Pro — 2439)

SWE-Bench Verified: 80,6% (GPT-5.2 — 80,0%, Opus 4.6 — 80,8%)

Terminal-Bench 2.0: 68,5% (GPT-5.2 — 54,0%, Sonnet 4.6 — 59,1%)

SciCode: 59% (GPT-5.2 — 52%, Sonnet 4.6 — 47%)

Особенно в соревновательных тестах программирования, результат Elo 2887 показывает, что преимущества в сложных алгоритмах и многошаговой логике программирования становятся все более очевидными.

Мультимодальные и длинные тексты остаются на высоком уровне

В области мультимодального понимания и обработки длинных текстов Gemini 3.1 Pro демонстрирует стабильные показатели:

MMMU Pro: 80,5%

MMLU: 92,6%

MRCR v2 (128k): 84,9%

1M токенов длинных текстов: 26,3%

Это означает, что модель не только способна к рассуждению, но и сохраняет согласованность и точность в контекстах большого объема информации.

От ответа на вопросы к непосредственному созданию результатов

Google подчеркивает, что ценность 3.1 Pro заключается не только в баллах, но и в практических возможностях применения.

Например, модель может напрямую генерировать анимационный SVG-код. Такой вывод основан исключительно на коде, а не на изображениях, что позволяет масштабировать без потери качества, сохранять четкость и иметь значительно меньший размер файла по сравнению с традиционными видеоформатами, что удобно для внедрения на сайты.

Эта способность показывает, что модель переходит от «ответного инструмента» к «инструменту для творчества и разработки».

Одновременный запуск на нескольких платформах для раннего тестирования бизнесом и разработчиками

В настоящее время Gemini 3.1 Pro доступна в виде предварительного просмотра:

Разработчикам

Gemini API (Google AI Studio)

Gemini CLI

Google Antigravity

Android Studio

Бизнесу

Vertex AI

Gemini Enterprise

Потребителям

Gemini App (Pro и Ultra — с расширенными лимитами использования)

NotebookLM (только для Pro и Ultra)

Google заявляет, что этап предварительного просмотра будет продолжаться с дальнейшей оптимизацией, особенно в области агентских рабочих процессов, и после этого модель будет полностью запущена.

Эпоха «глубокого мышления» в AI-соревнованиях

Исходя из всех тестов, Gemini 3.1 Pro явно делает акцент на более высоком уровне рассуждения и профессиональных сценариях. Особенно важен результат ARC-AGI-2 — 77,1%, что символизирует прорыв в способности модели решать неизвестные логические задачи.

На фоне все более ожесточенной конкуренции среди крупных моделей Google явно делает ставку на «глубже умение», а не только на скорость генерации или плавность диалога.

По мере того как компании и разработчики начинают тестировать эту модель, её истинная ценность постепенно проявится в практическом применении. Конкуренция в области ИИ, возможно, смещается с генеративных возможностей к более комплексным способностям мышления.

Эта статья о появлении Gemini 3.1 Pro: от абстрактных рассуждений до соревновательного программирования, Google вновь устанавливает новые стандарты для передового ИИ. Первоначально опубликовано на Chain News ABMedia.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев