Шість проривів у сфері штучного інтелекту, які змінили 2025 рік: що правильно зрозумів Андрея Карпати

2026-01-21 12:08:16

Андрей Карпати, один із найвпливовіших дослідників штучного інтелекту у світі, запропонував свою особисту точку зору щодо трансформаційних змін, що формують штучний інтелект у 2025 році. Його спостереження освітлюють не лише те, що сталося минулого року, а й напрямок розвитку всієї галузі. Між проривами у підкріплювальному навчанні, новими парадигмами застосувань і фундаментальними змінами у способах взаємодії людей із ШІ, ландшафт рухався швидше, ніж більшість прогнозували.

RLVR: Новий фундамент, що замінює навчання з учителем

План дій щодо тренування ШІ увійшов у нову главу, коли підкріплювальне навчання на основі перевірюваних нагород (RLVR) перейшло з експериментальної стадії у масове застосування. За аналізом Андрея Карпати, цей зсув кардинально змінив вигляд мовних моделей виробничого рівня.

Багато років стандартний процес виглядав так: попереднє навчання → тонке налаштування з учителем → підкріплювальне навчання за відгуками людини (RLHF). Це було стабільно, доведено і стало основою для великих лабораторій ШІ. Але щось змінилося у 2025 році.

RLVR змінює гру, навчаючи моделі у середовищах з автоматично перевірюваними сигналами нагород — уявіть собі математичні задачі з однозначно правильними відповідями або програмні виклики, де код або працює, або ні. Замість покладанняся на людське судження, ці об’єктивні механізми зворотного зв’язку дозволяють моделям розвивати щось, що нагадує справжнє мислення. Вони навчаються розкладати задачі на проміжні кроки і відкривати кілька шляхів розв’язання через ітеративне вдосконалення.

DeepSeek-R1 вперше продемонстрував цей принцип, але o1 (пізньої 2024) та o3 (початку 2025) від OpenAI довели, що це масштабовано. Як зазначив Андрій Карпати, найбільше його здивувало не просто зростання продуктивності — а масивний зсув у обчислювальних ресурсах. RLVR споживає набагато більше обчислювальної потужності, ніж традиційне тонке налаштування, фактично перенаправляючи ресурси, спочатку призначені для попереднього навчання. Це означає, що здобутки у можливостях у 2025 році не зумовлені тренуванням більших моделей, а більш розумним тренуванням, із значно розширеними фазами оптимізації.

Ще один прорив: цей новий підхід відкрив цілком новий вимір масштабування — здатність регулювати можливості моделі під час тестування, розширюючи траєкторії висновків і дозволяючи більше “часу на роздуми”. Це роз’єднує масштабування можливостей від розміру моделі у способах, раніше неможливих.

Привид інтелекту проти зубчастої продуктивності

Андрей Карпати ввів концепцію, яка переосмислює, як галузь думає про когнітивні здібності ШІ: ми не еволюціонували як тварини, ми викликаємо привидів.

Весь процес тренування кардинально відрізняється — нейронна архітектура, дані, алгоритми і, що важливо, цілі оптимізації. Тому не дивно, що великі мовні моделі демонструють інтелект, радикально відмінний від біологічних мозків. Порівнювати їх із тваринами або біологічним інтелектом — зовсім не те саме.

Людські нейронні мережі сформувалися в процесі виживання у племінних екосистемах. Моделі ШІ були сформовані для імітації тексту, розв’язання математичних головоломок і здобуття людського схвалення у змагальних бенчмарках. Коли ви оптимізуєте під зовсім інші цілі, отримуєте зовсім інші результати.

Це призводить до дивної характеристики продуктивності: зубчастих, зубчасто-зубчастих кривих можливостей. Моделі можуть демонструвати енциклопедичні знання у один момент і плутати елементарні шкільні міркування — у інший. Вони досягають успіху у перевірюваних сферах і спотикаються у відкритих контекстах. Ця нерівномірність у можливостях — не баг, а прямий наслідок самого режиму тренування.

Ось де важливий скептицизм Андрея Карпати: він розробив те, що називає “загальною байдужістю” до бенчмарків у 2025 році. Причина проста — бенчмарки є перевірюваними середовищами, що робить їх ідеальними цільовими для перенавчання RLVR. Команди неминуче створюють тренувальні простори поблизу вбудовувань бенчмарків і насичують їх вузькими можливостями. “Тренування на тестовому наборі” стало нормою у галузі. Масштабування всіх бенчмарків більше не є ознакою справжнього прогресу у досягненні AGI.

Cursor: З’являється рівень застосунків

Вибуховий ріст Cursor у 2025 році відкрив щось важливе: з’явився цілком новий рівень у стеку застосунків ШІ.

За словами Андрея Карпати, Cursor працює тому, що він вирішує конкретну вертикальну проблему — генерацію коду у реальних процесах розробки, а не тому, що він кращий у загальному чатботі. Архітектура, що підтримує інструменти на кшталт Cursor, включає три інтегровані компоненти: інженерія контексту (витягування релевантної інформації), оркестрація кількох викликів LLM у все складніші орієнтовані ациклічні графи (балансування продуктивності та вартості), і інтерфейси користувача, орієнтовані під конкретний застосунок із людським контролем.

Це спричинило широку дискусію: чи домінуватимуть платформи великих мовних моделей (як API OpenAI) у всьому рівні застосунків, чи з’являться спеціалізовані інструменти? Прогноз Андрея Карпати: платформи поступово стануть “університетами-генералістами”, що вироблятимуть здатні, але неспеціалізовані результати. Реальна цінність перейде до компаній, що візьмуть ці здатні моделі, тонко налаштують їх на власних даних, інтегрують сенсори й актуатори і перетворять їх на спеціалізовані “професійні команди”, які можна розгортати у конкретних вертикалях.

Наслідок: Cursor — не кінцева мета, а шаблон. Очікуйте десятки вертикально-спеціалізованих інструментів за цим самим сценарієм.

Claude Code: Агенти, що живуть локально

З’явлення Claude Code продемонструвало щось, що привернуло увагу Андрея Карпати: ефективні агенти ШІ не обов’язково повинні жити у хмарі.

Технологія проходить через цикл використання інструментів і міркувань у циклі, що дозволяє більш стійке і складне розв’язання проблем, ніж прості чат-інтерфейси. Але справжнім враженням для Андрея Карпати стала архітектурна опція: Claude Code працює безпосередньо на комп’ютері користувача, глибоко інтегрований у локальні файли, особисті середовища і індивідуальні робочі процеси.

Це свідомий відхід від стратегічного напрямку OpenAI. OpenAI інвестував значні ресурси у хмарних агентів, оркестрованих у контейнеризованих середовищах ChatGPT. Хоча цей підхід обіцяє “найвищу форму AGI”, наразі ми перебуваємо у фазі нерівномірного розвитку із неперевіреними перевагами.

Розгортання агентів локально — поруч із розробниками, тісно інтегроване з їхнім конкретним робочим контекстом — виявилося швидшим і більш практичним наразі. Claude Code реалізував цю ідею, упакувавши її у елегантний командний рядковий інструмент, що кардинально змінює інтерфейс ШІ. Це вже не просто сайт, як Google. Це маленький спрайт, що живе у вашому комп’ютері, безпосередньо співпрацюючи з вашим робочим процесом. Це зовсім інша парадигма людсько-ШІ взаємодії.

Vibe Coding: Програмування без коду

До 2025 року ШІ подолав критичний поріг: ви можете описати, що хочете, англійською, і з’явиться робоче програмне забезпечення, без необхідності розуміти внутрішню реалізацію.

Андрей Карпати випадково ввів термін “Vibe Coding” у Twitter, не очікуючи, що він стане галузевою тенденцією. Але він ідеально відображає те, що сталося — програмування стало доступним для всіх, а не лише для навченої професійної спільноти.

Це пов’язано з ширшим патерном, який визначив Андрей Карпати: звичайні люди отримують більше користі від великих мовних моделей, ніж експерти. Професіонали вже мали інструменти і глибокі знання. Звичайні люди нічого не могли побудувати. Тепер — можуть.

Але Vibe Coding корисне і для професіоналів — інакше. Воно дозволяє розробникам реалізовувати функції, які “ніколи б не були написані інакше”, бо раптом код стає безкоштовним, ефемерним і знищуваним. Створюючи nanochat, Андрей Карпати використовував Vibe Coding для написання власних, ефективних токенізаторів BPE на Rust без вивчення мови або використання існуючих бібліотек. Він прототипував цілі системи виключно для перевірки можливості. Писав однопроєктні застосунки просто для відлагодження конкретних вразливостей.

Ця економічна зміна — коли код має нульові витрати на перемикання — переформатує екосистему розробки програмного забезпечення і назавжди перерозподілить межі кар’єри у цій галузі.

Nano Banana: LLM нарешті отримали інтерфейси користувача

Прорив Google Gemini Nano — те, що Андрей Карпати називає “Nano Banana” — є одним із найруйнівніших парадигмальних зсувів 2025 року.

Андрей Карпати просто формулює: великі мовні моделі — це наступна велика парадигма обчислень після епохи ПК 1970-80-х років. Тому слід очікувати подібних інновацій з тих самих причин — у паралелі з еволюцією персональних комп’ютерів, мікроконтролерів і самого інтернету.

Поточний спосіб взаємодії людини з комп’ютером досі нагадує командний ряд 1980-х. Текст домінує, хоча він примітивний для комп’ютерів і неправильний для людей. Люди вважають читання тексту повільним і болісним. Вони віддають перевагу візуальним і просторовим каналам — саме тому графічні інтерфейси користувача трансформували персональні комп’ютери десятиліттями тому.

Та сама ідея застосовується і до ШІ: моделі мають спілкуватися через зображення, інфографіку, слайди, білборди, відео, веб-застосунки — будь-який формат, який дійсно віддають перевагу люди. Перші кроки зроблено через “візуальне оформлення тексту”, наприклад, емодзі і Markdown. Але хто в кінцевому підсумку побудує повний графічний інтерфейс для ШІ?

Nano Banana — це ранній прототип цього майбутнього. Його прорив виходить за межі генерації зображень. Що робить його важливим — це інтегрована здатність: генерація тексту, зображень і вміння орієнтуватися у світі, закодовані у ваги моделі. Це злиття створює принципово іншу парадигму інтерфейсу, ніж текстові моделі.

Конвергенція: Візія Андрея Карпати щодо майбутнього

Ці шість змін не існують ізольовано. Спостереження Андрея Карпати відкривають галузь у процесі трансформації: від чистого масштабування моделей до більш розумних методів тренування і спеціалізованих застосувань. Від хмарних універсальних платформ до локально розгорнутих агентів, інтегрованих з людськими робочими процесами. Від текстоцентричних інтерфейсів до візуальних і просторових комунікацій.

2025 рік довів, що штучний інтелект не просто став трохи кращим. Він кардинально реорганізував спосіб тренування, розгортання і комунікації. Наступна фаза належатиме тим, хто першим освоїть ці нові парадигми.

SIX0,44%

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.