Коли змагання великих мовних моделей переходять від «хто швидше відповість» до «хто глибше мислить», Google знову представляє нове покоління основної зброї. 19 лютого Google офіційно оголосила про випуск Gemini 3.1 Pro — це не лише оновлення версії серії Gemini 3, а й всебічне покращення високорівневих здатностей логічного мислення. Офіційно заявлено, що 3.1 Pro створений для складних завдань без стандартної відповіді, з ціллю застосування у наукових дослідженнях, інженерній розробці та довгострокових сценаріях прийняття рішень.
З відкритих даних тестових баз, це оновлення не є порожніми словами, а демонструє прорив у кількох високорівневих складних тестах.
Основне оновлення для складних завдань
У своїй заяві Google позиціонує Gemini 3.1 Pro як «розумнішу, більш здатну базову модель», підкреслюючи її прорив у ключових логічних здібностях. Ця модель базується на дослідженнях попередньої Gemini 3 Deep Think, додатково посилюючи базову інтелектуальну здатність, щоб краще виконувати багатоступеневу логіку, абстрактне мислення та розбір професійних питань.
Порівняно з Gemini 3 Pro, випущеною у листопаді 2025 року, 3.1 Pro — це не просто оптимізація продуктивності, а структурне зростання логічних здібностей.
ARC-AGI-2 піднявся до 77.1%: подвоєння здатності до абстрактного мислення
Найбільш вражаючий результат — це показник ARC-AGI-2, який вважається високорівневим індикатором логічних здібностей AI. Цей тест спеціально оцінює здатність моделі вирішувати «нові логічні моделі», уникаючи залежності від вже наявних знань.
За відкритими даними:
Gemini 3.1 Pro: 77.1% (перевірка ARC Prize)
Gemini 3 Pro: 31.1%
Sonnet 4.6: 58.3%
Opus 4.6: 68.8%
GPT-5.2: 52.9%
У порівнянні з попереднім показником 31.1%, 3.1 Pro майже подвоює результат. Це означає, що модель здатна краще абстрактно мислити та узагальнювати шаблони при роботі з невідомими задачами.
Паралельне підвищення професійних знань і наукового мислення
У тесті GPQA Diamond, що оцінює наукові знання, Gemini 3.1 Pro отримала 94.3%, що вище за GPT-5.2 (92.4%), Opus 4.6 (91.3%) та Sonnet 4.6 (89.9%).
Це свідчить, що 3.1 Pro не лише здатна працювати з абстрактною логікою, а й підтримує високий рівень інтеграції професійних знань і наукового мислення.
Значне покращення програмних можливостей: змагання на рівні професіоналів
У тестах програмування та агентських завданнях Gemini 3.1 Pro також показала високі результати.
LiveCodeBench Pro: Elo 2887 (GPT-5.2 — 2393, Gemini 3 Pro — 2439)
SWE-Bench Verified: 80.6% (GPT-5.2 — 80.0%, Opus 4.6 — 80.8%)
Terminal-Bench 2.0: 68.5% (GPT-5.2 — 54.0%, Sonnet 4.6 — 59.1%)
SciCode: 59% (GPT-5.2 — 52%, Sonnet 4.6 — 47%)
Особливо в змаганнях з програмування, результат Elo 2887 демонструє переваги у складних алгоритмах і багатоступеневій логіці.
Підтримка мультимодальних і довгих текстових можливостей
У мультимодальному розумінні та обробці довгих текстів Gemini 3.1 Pro також демонструє стабільну продуктивність:
MMMU Pro: 80.5%
MMLU: 92.6%
MRCR v2 (128k): 84.9%
1M токенів довгий текст pointwise: 26.3%
Це означає, що модель здатна не лише логічно мислити, а й зберігати послідовність і точність у великих контекстах.
Від відповіді на питання до безпосереднього створення результатів
Google підкреслює, що цінність 3.1 Pro полягає не лише у балах, а й у практичних застосуваннях.
Наприклад, модель може безпосередньо генерувати анімовані SVG-коди. Такі виходи базуються виключно на коді, без зображень, що дозволяє безліч масштабувань і зберігає чіткість, а розмір файлу значно менший за традиційні відеоформати і може бути безпосередньо вставлений у веб-сайти.
Ця здатність свідчить про перехід моделі від «інструменту відповіді» до «інструменту створення і розробки».
Паралельний запуск на кількох платформах для корпоративних і розробницьких користувачів
Зараз Gemini 3.1 Pro доступна у режимі попереднього перегляду:
Розробники
Gemini API (Google AI Studio)
Gemini CLI
Google Antigravity
Android Studio
Корпоративні клієнти
Vertex AI
Gemini Enterprise
Споживачі
Gemini App (для користувачів Pro та Ultra з обмеженнями вищого рівня)
NotebookLM (доступний лише для користувачів Pro та Ultra)
Google заявляє, що на етапі попереднього перегляду триватиме подальша оптимізація, особливо у застосуваннях агентських робочих процесів, і згодом модель буде офіційно запущена у повному масштабі.
Ера глибокого мислення у AI-змаганнях
З усіх тестів видно, що Gemini 3.1 Pro явно зосереджена на високорівневих логічних здібностях і професійних сценаріях. Результат ARC-AGI-2 у 77.1% особливо важливий, оскільки він символізує прорив у здатності моделі працювати з невідомими логічними задачами.
У зростаючій конкуренції великих моделей Google очевидно робить ставку на «глибше розуміння», а не лише на швидкість генерації або плавність діалогу.
Зі стартом тестування цієї моделі підприємствами і розробниками її справжня цінність поступово проявиться у практичних застосуваннях. Конкуренція у сфері AI, ймовірно, зосередиться не лише на здатності генерувати, а й на більш комплексному мисленні.
Ця стаття про появу Gemini 3.1 Pro: від абстрактного мислення до змагань у програмуванні — Google знову встановлює новий високий стандарт у передових AI, що з’явилася у Chain News ABMedia.