Перший у історії AI, який створює AI! GPT-5.3 бере участь у розробці себе, фантастика стає реальністю

OpenAI випустила GPT-5.3-Codex — першу модель, яка «бере участь у створенні себе» для налагодження власного коду, управління розгортанням і діагностики тестування. Карпаті назвав цю редакцію «найближчою до сцени зльоту ШІ».

ШІ почав створювати технологічні сингулярності та прориви в ШІ

Офіційний акаунт OpenAI опубліковано: GPT-5.3-Codex офіційно запущено, який є «першим, хто бере участь у створенні власної моделі». Що це означає? Іншими словами, під час розробки цей ШІ допомагав налагоджувати власний навчальний код, керувати процесом розгортання та діагностувати власні результати тестів. У людських термінах ШІ почав створювати ШІ.

Андрій Карпаті, колишній дослідник OpenAI та директор Tesla AI, одразу після прочитання написав у Twitter: «Це найближче, що я коли-небудь бачив до сцени зльоту ШІ в науковій фантастиці.» Ця оцінка провідних дослідників ШІ є вагомою, оскільки Карпаті особисто пережив кілька ключових етапів розвитку ШІ, і його судження базується на глибокому технічному розумінні.

ШІ ітерує сам себе, це не маркетингова риторика. Згідно з внутрішнім розкриттям OpenAI, GPT-5.3-Codex робив такі речі під час розробки: аналізував тести, які не позначили навчальні журнали, пропонував виправлення для навчальних скриптів і профілів, генерував рецепти розгортання та підсумовував і оцінював аномалії для перевірки людьми. Що це означає? ШІ вже не просто інструмент, він починає ставати частиною команди розробників, і це той тип, який може покращувати себе.

Ця здатність брати участь у розробці просувається через традиційне позиціонування ШІ. Раніше моделі ШІ розробляли, навчалися та впроваджувалися виключно людьми, і ШІ був пасивним продуктом. Тепер GPT-5.3 відіграв активну роль у власному зародженні, і хоча ця зміна ролі ще перебуває під людським наглядом, має далекосяжні наслідки. Це натякає на можливість: майбутні моделі ШІ можуть бути здебільшого розроблені та оптимізовані самим ШІ, а люди надаватимуть лише вказівки та фінальний огляд.

Самоучасть GPT-5.3 у розробці

Аналіз навчальних журналів: Автоматично позначає невдалі тести для виявлення аномалій під час навчання

Рекомендований план ремонту: Запропонувати покращення тренувальних скриптів і профілів

Згенеруйте рецепт розгортання: Автоматизація процесу розгортання та зменшення ручних операцій

Аномалія підсумкової оцінки: Організувати складні результати оцінювання у звіти, зрозумілі людині

Нещодавня стаття SEAL, опублікована MIT (arXiv:2506.10943), описує архітектуру ШІ, яка безперервно навчається після розгортання, еволюціонуючи без повторного навчання. Варто зазначити, що деякі дослідники SEAL тепер приєдналися до OpenAI. Це означає, що ШІ змінився з «статичного інструменту» на «динамічну систему», навчання більше не зупиняється на розгортанні, а межі висновків і навчання тануть. GPT-5.3 може стати першим комерційним застосуванням цієї нової архітектури.

77,3% перевершив рекорд Клода

5 лютого OpenAI та Anthropic обидві випустили нове покоління моделей з інтервалом у 20 хвилин. Спочатку Anthropic випустила Claude Opus 4.6, а потім OpenAI запустила GPT-5.3-Codex. Оскільки OpenAI хоче використовувати GPT-5.3-Codex для снайпу нових моделей інших, він має певні можливості. Дані не брешуть: GPT-5.3-Codex встановив нові рекорди у численних галузевих бенчмарках одразу після запуску.

Terminal-Bench 2.0 тестує операційні можливості ШІ в реальному термінальному середовищі, компілюючи код, навчаючи моделі та налаштовуючи сервери. GPT-5.3-Codex набрав 77,3%, тоді як GPT-5.2-Codex — лише 64,0%, а Claude Opus 4.6 — 65,4%. Це зростання на 13 відсоткових пунктів між поколіннями, що вже є величезним кроком уперед у сфері ШІ. Порівняння 77,3% проти 65,4% показує, що GPT-5.3 забезпечує значну перевагу у реальних інженерних завданнях.

SWE-Bench Pro — це бенчмарк, спеціально розроблений для тестування реальних можливостей програмної інженерії, що охоплює чотири мови програмування: Python, JavaScript, Go та Ruby. GPT-5.3-Codex набрав 56,8%, перевершивши 56,4% свого попередника, GPT-5.2-Codex, і продовжив утримувати перше місце в галузі. Ще важливіше, що OpenAI показав, що GPT-5.3-Codex використовує найменшу кількість вихідних токенів серед усіх моделей, коли досягає цього показника, що означає, що він не лише точний, а й ефективний.

OSWorld-Verified перевіряє здатність ШІ виконувати продуктивні завдання у візуальному робочому середовищі, редагувати таблиці, створювати презентації, працювати з документами тощо. GPT-5.3-Codex набрав 64,7%, порівняно з середнім показником для людей у 72%. Це означає, що вона наблизилася до продуктивності звичайних людей у роботі з комп’ютером, майже подвоївшись порівняно з попередником. Ця майже людська продуктивність робить ШІ вперше справді здатним до офісної роботи, а не просто як допоміжний інструмент.

Claude контрить команди жетонів і агентів по 100 тисяч

Ще більш примітно, що Claude Opus 4.6 вперше підтримує контекстне вікно токена (бета) на рівні Opus, яке може одночасно обробляти всю кодову базу або сотні сторінок документів, а також запустило функцію Agent Teams, де кілька AI-агентів можуть одночасно працювати над програмуванням, тестуванням і написанням документів.

Коли OpenAI та Anthropic випускають свої флагманські моделі в один день і в один і той самий момент, це змагання вже не просто технічне змагання, а боротьба за майбутню форму ШІ: шлях «самоеволюції» OpenAI чи шлях «співпраці з багатьма агентами» Anthropic? Стратегія OpenAI полягає в тому, щоб зробити один ШІ потужнішим і навіть покращити себе. Стратегія Anthropic полягає в тому, щоб дозволити кільком ШІ співпрацювати над складними завданнями через розподіл праці та співпрацю.

Контекст 100K токенів — це технологічний прорив. Це еквівалентно приблизно 75 мільйонам англійських слів або 300 китайських ієрогліфів, що достатньо, щоб вмістити весь код середнього програмного проєкту або товсту технічну документацію. Ця здатність дозволяє Клоду «бачити» весь проєкт, а не фрагментарно розуміти. Для аналізу архітектури та рефакторингу масштабних проєктів цей глобальний погляд є ключовим.

Agent Teams приносить концепцію співпраці в ШІ. Один агент пише код, інший тестує, а третій — документацію, і вони можуть спілкуватися та координуватися між собою. Ця модель імітує роботу команд програмного забезпечення і може бути краще підходити для певних ситуацій, ніж один суперШІ. Однак багатоагентна співпраця також вводить нові складнощі: як координувати, як уникати конфліктів і як забезпечити послідовність.

Обидва варіанти мають свої переваги та недоліки. Шлях саморозвитку OpenAI є більш агресивним, і якщо він буде успішним, може призвести до експоненційного покращення можливостей, але також може вийти з-під контролю. Мультиагентний шлях Anthropic є більш консервативним, зменшуючи одиночну точку ризику за рахунок розширення можливостей, але витрати на координацію можуть обмежувати ефективність. У міру того, як ШІ починає розвиватися у реальному житті, питання управління змінюватимуться від «наскільки він розумний» до «як керувати системою, яка постійно змінюється?» І коли дві провідні компанії з ШІ випускають проривні моделі поспіль протягом 20 хвилин, часове вікно для людського мислення та підготовки скорочується з видимою швидкістю, видимою неозброєним оком.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Війна, вихідні та заблокована ліквідність: як інцидент з авіаударом по Ірану показує, як RWA може переосмислити глобальний торговий час

28 лютого 2026 року США та Ізраїль здійснили авіаудар по Ірану, що виявило обмеження традиційних фінансових ринків і спричинило обмеження ліквідності. Того ж часу ринок криптовалют продемонстрував більшу стійкість, забезпечуючи цілодобову торгівлю через токенізовані активи, що хеджує ризики. Ця подія сприяла тенденції перенесення фінансових активів у блокчейн, підкреслюючи важливість ліквідності під час криз і змінюючи часові закони фінансової діяльності у майбутньому.

TechubNews8хв. тому

JPMorgan вважає, що закон CLARITY стане каталізатором на тлі розпродажу криптовалют

Звіт JPMorgan обговорює запропонований Закон CLARITY, спрямований на встановлення чітких правил для цифрових активів, який потенційно може бути прийнятий до середини 2026 року. Основні питання включають дозволи на доходність стабільних монет і правила щодо конфлікту інтересів, що затримують прогрес.

CryptoFrontNews44хв. тому

ProCap Financial додало покупку 450 біткоїнів

BlockBeats повідомляє, 2 березня, згідно з повідомленням The Wall Street Journal, криптоінвестор Anthony Pompliano, що належить публічній компанії ProCap Financial, активно викуповує акції, щоб зменшити дисконтування щодо чистої вартості активів, одночасно придбавши 450 біткоїнів.

GateNews1год тому

Криптовалюти на зображенні, оскільки JPMorgan скорочує зростання нефтової галузі для економік Перської затоки

JPMorgan знизив середній показник зростання країн ЗГК на 0,3 процентних пункти. Криптовалюти торгуються нижче за очікувані значення. Долар США посилився, а золото зросло за 24 години. JPMorgan скоригував свій прогноз щодо зростання нефтової галузі економік ЗГК. Це вивело криптовалюти у

TheNewsCrypto1год тому

Криптовалютні ринки тримаються на місці на тлі зростаючої напруги в Ірані

На тлі зростаючої напруженості між США та Іраном, Біткоїн та Ефіріум короткочасно знизилися, але швидко відновилися. Демонструвалася стійкість ринку, оскільки $300M у ліквідаціях залишалися обмеженими, а деякий капітал переорієнтувався на токенізоване золото. Потоки опціонів свідчать про очікування відновлення у березні попри волатильність.

CryptoFrontNews1год тому

CoinShares:інвестиційні продукти у сфері цифрових активів за минулий тиждень мали чистий приплив близько 1 мільярда доларів

Згідно з щотижневим звітом CoinShares, чистий приплив цифрових активів у минулому тижні склав приблизно 1 мільярд доларів США, з яких США внесли 957 мільйонів, з них внутрішній потік Біткойна склав 881 мільйон, потік Ethereum — 117 мільйонів, Solana — 53,8 мільйона, що свідчить про розкол у поглядах на ринок.

GateNews2год тому
Прокоментувати
0/400
Немає коментарів