OpenAI випустила AI-модель GPT-5.5 із нативним використанням комп’ютера

CryptoFrontier

OpenAI офіційно випустила GPT-5.5 23 квітня 2026 року, нову модель ШІ, призначену для розуміння намірів користувача в реальних застосунках завдяки вбудованим можливостям використання комп’ютера. Модель має універсальні можливості нативної роботи, які дозволяють їй переміщатися між десктопними застосунками, натискати кнопки та вводити текст для багатокрокових робочих процесів, згідно з оголошенням OpenAI.

GPT-5.5 поєднує нативне використання комп’ютера з розширеним міркуванням, автономно навігуючи інструментами програмного забезпечення, потрібними для задач високого рівня професійної діяльності. Контекстне вікно моделі ~1,1 мільйона токенів дозволяє їй обробляти масивні фінансові набори даних, які раніше вимагали ручного розбиття на частини. Фінансова команда OpenAI використала GPT-5.5 для перегляду 24,771 податкових форм K-1 (71,637 сторінок) і завершила задачу на два тижні швидше, ніж у попередньому році.

Показники продуктивності

GPT-5.5 набрала 88,5% на внутрішніх задачах моделювання інвестиційного банкінгу та 60% на бенчмарку FinancialAgent v1.1, випередивши GPT-5.4 на чотири пункти. Модель досягла 84,9% на GDPval, що тестує здатність агентів продукувати конкретну знаннєву роботу в межах 44 професій. На OSWorld-Verified, вимірюванні автономних реальних операцій комп’ютером, модель досягла 78,7%. GPT-5.5 набрала 98% на Tau2-bench Telecom, який тестує надзвичайно складні робочі процеси служби підтримки клієнтів.

Співробітник команди Go-to-Market підтвердив, що автоматизація щотижневих бізнес-звітів заощадить приблизно 5-10 годин ручної роботи на тиждень.

Генерація коду та оптимізація системи

OpenAI повідомляє, що GPT-5.5 використовувалася, щоб допомогти написати код для власної інфраструктури сервінгу. Модель досягла «Оптимізації рівня системи», аналізуючи виробничі патерни трафіку, щоб написати власні евристики балансування навантаження, збільшивши власну швидкість генерації токенів на 20%.

У тесті для розробників модель попросили «переформатувати архітектуру markdown-редактора», і вона повернула майже повний стек із 12 відмінностями з мінімальними виправленнями з боку людини. OpenAI зазначає, що нова модель знаходить правильну відповідь за меншу кількість ходів і використовує на 40% менше токенів для тих самих задач Codex порівняно з GPT-5.4.

Ден Шиппер, засновник і CEO Every, описав GPT-5.5 як першу кодову модель, яка має «серйозну концептуальну ясність». Шиппер тестував GPT-5.5 після того, як він і його найкращий інженер провели кілька днів за відлагодженням проблеми, що виникла після релізу, в застосунку. За словами Шиппера, GPT-5.5 досягла того, чого не змогла GPT-5.4: вона проаналізувала зламаний код і згенерувала переписування, яке інженер зрештою вирішив застосувати. Модель може «пам’ятати» та перехресно посилатися на цілі бібліотеки інформації, не втрачаючи свого місця, зменшуючи «галюцинації», які переслідували попередні версії.

Автономні можливості та самокорекція

OpenAI стверджує, що GPT-5.5 оптимізована для «самокорекції» та автономності. Вона краще інтерпретує неоднозначні інструкції та використовує комп’ютерний інтерфейс (clicking, typing, browsing), щоб досягати цілей без втручання людини. Модель стає особливо корисною, коли агенту потрібно керувати програмним забезпеченням, вести робочі процеси, насичені терміналом, або міркувати в межах цілого кодовго базису (500K+ токенів) з високою точністю пошуку.

Функція мислення GPT-5.5

У ChatGPT OpenAI представила «GPT-5.5 Thinking», яку компанія називає такою, що розблоковує швидшу допомогу для складніших проблем. Ця функція забезпечує розумніші, більш лаконічні відповіді, щоб допомогти користувачам виконувати складні задачі ефективніше. Вона особливо добре справляється з професійною роботою на кшталт синтезу й аналізу інформації, програмування та документомістких задач на кшталт досліджень, зокрема під час використання плагінів.

Ранні тестувальники GPT-5.5 Pro повідомляють про суттєве покращення і якості, і складності роботи, яку ChatGPT може брати на себе. Низька затримка робить її більш практичною для вимогливих задач, ніж GPT-5.4 Pro. Відповіді GPT-5.5 Pro є добре структурованими, релевантними, корисними та точними, із особливо сильними результатами в праві, data science, бізнесі та освіті.

Ціноутворення та доступність

Хоча базова версія доступна, найбільш здатна версія (GPT-5.5 Pro) коштує $100/місяць для індивідуальних передплатників. Для бізнесу вартість за токен виходу приблизно вдвічі вища, ніж у GPT-5.4, навіть з 40% вищою ефективністю токенів. Загальні витрати на масштабні агентні розгортання можуть бути суттєвими. Зростає занепокоєння, що найвищий рівень міркувань стане «розкішшю», доступною лише для компаній із добре фінансованими ресурсами, потенційно розширюючи розрив у продуктивності між великими підприємствами та меншими стартапами.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
AprDaydreamvip
· 3год тому
Сподіваюся, офіційні органи нададуть механізм аудиту дій/відтворення, інакше у разі проблем важко буде притягнути до відповідальності, особливо щодо автоматичних операцій з активами.
Переглянути оригіналвідповісти на0
PaperHandsProvip
· 3год тому
Реальне застосування «розуміння намірів» — це справжня складність, сподіваюся, більше не з’являтиметься ситуація, коли ви хочете забронювати квитки на літак, а він змінює ваше резюме.
Переглянути оригіналвідповісти на0
Half-SectionedSucculentvip
· 3год тому
Трохи сподівань, трохи страху: можливість натиснути мишею означає, що можна робити багато речей, які раніше могли виконуватися лише за допомогою «людських кліків», тому системи управління ризиками та протидії шахрайству потрібно оновлювати.
Переглянути оригіналвідповісти на0
ACalmnessWithAHintOfPomelovip
· 3год тому
Ця хвиля також вплине на Web3, адже автоматизація ланцюгових операцій, процеси підпису та взаємодія з гаманцями, якщо їх зробити безшовними, змінить форму продукту.
Переглянути оригіналвідповісти на0
StarsInTheGlassDomevip
· 3год тому
API і ціну поки не поспішайте, спершу подивіться, чи може вона витримати спливаючі вікна, багатоконтурність і коливання мережі у складному настільному середовищі.
Переглянути оригіналвідповісти на0
GateUser-b665e41cvip
· 3год тому
Відчуття еволюції від «можу говорити і писати» до «можу виконувати та доставляти», наступним кроком є надання їй кращої пам’яті та управління завданнями.
Переглянути оригіналвідповісти на0
LintCollectorvip
· 3год тому
Якщо справді можливо з'єднати через різні застосунки: пошук інформації у браузері → обробка в Excel → створення презентації у PowerPoint → надсилання електронною поштою, тоді це буде повний цикл роботи офісного процесу.
Переглянути оригіналвідповісти на0
DegenWithNotebookvip
· 3год тому
Нарешті з’явилися на настільних платформах у нативному режимі? Тепер справді доведеться бути «цифровим стажером».
Переглянути оригіналвідповісти на0