OpenAI официально выпустила GPT-5.5 23 апреля 2026 года — новую модель ИИ, предназначенную для понимания намерений пользователя в реальных приложениях за счет нативных возможностей работы с компьютером. Модель обладает универсальными нативными возможностями, которые позволяют ей навигировать по настольным приложениям, нажимать кнопки и вводить текст для многошаговых рабочих процессов, согласно объявлению OpenAI.

GPT-5.5 объединяет нативную работу с компьютером и расширенные механизмы рассуждения, автономно навигируя по программным инструментам, необходимым для задач высокого профессионального уровня. Окно контекста модели ~1,1 млн токенов позволяет ей обрабатывать массивные финансовые наборы данных, которые ранее требовали ручной нарезки на части. Финансовая команда OpenAI использовала GPT-5.5 для проверки 24 771 налоговой формы K-1 (71 637 страниц) и завершила задачу на две недели быстрее, чем в предыдущем году.

Тесты производительности

GPT-5.5 набрала 88,5% на внутренних задачах моделирования для инвестиционного банкинга и 60% на бенчмарке FinancialAgent v1.1, обойдя GPT-5.4 на четыре пункта. Модель достигла 84,9% на GDPval, где проверяются способности агентов выполнять конкретную интеллектуальную работу в 44 профессиях. На OSWorld-Verified, измеряющем автономные операции модели на реальном компьютере, она достигла 78,7%. GPT-5.5 набрала 98% на Tau2-bench Telecom — тесте для чрезвычайно сложных сценариев обслуживания клиентов.

Сотрудник команды Go-to-Market подтвердил, что автоматизация еженедельных бизнес-отчетов сэкономит примерно 5–10 часов ручной работы в неделю.

Генерация кода и оптимизация системы

OpenAI сообщает, что GPT-5.5 использовалась, чтобы помочь написать код для ее собственной инфраструктуры обслуживания. Модель достигла «оптимизации на системном уровне», анализируя паттерны производственного трафика и создавая пользовательские эвристики балансировки нагрузки, увеличив собственную скорость генерации токенов на 20%.

В тесте для разработчиков модель попросили «реконструировать markdown-редактор», и она вернула почти полностью готовый стек из 12 диффов с минимальной правкой со стороны человека. OpenAI отмечает, что новая модель находит правильный ответ за меньшее число ходов и использует на 40% меньше токенов для тех же задач Codex по сравнению с GPT-5.4.

Дэн Шиппер, основатель и генеральный директор Every, охарактеризовал GPT-5.5 как первую кодирующую модель с «серьезной концептуальной ясностью». Шиппер протестировал GPT-5.5 после того, как он и его лучший инженер потратили несколько дней на отладку проблемы после релиза в приложении. По словам Шиппера, GPT-5.5 сделала то, чего GPT-5.4 не смогла: она проанализировала сломанный код и выдала переписывание, которое инженер в итоге решил использовать. Модель может «помнить» и делать перекрестные ссылки на целые библиотеки информации, не теряя своего места, снижая «галлюцинации», которые преследовали более ранние версии.

Автономные возможности и самокоррекция

OpenAI утверждает, что GPT-5.5 оптимизирована под «самокоррекцию» и автономность. Она лучше справляется с интерпретацией неоднозначных инструкций и использует компьютерный интерфейс (clicking, typing, browsing), чтобы достигать целей без вмешательства человека. Модель становится особенно полезной, когда агенту нужно работать с программным обеспечением, вести терминал-насыщенные рабочие процессы или рассуждать по целой кодовой базе (500K+ tokens) с высокой точностью извлечения.

Функция мышления GPT-5.5

В ChatGPT OpenAI представила «GPT-5.5 Thinking», которую компания описывает как средство, открывающее более быстрое помощь для более сложных задач. Функция обеспечивает более умные, более краткие ответы, чтобы помочь пользователям эффективнее выполнять сложные задачи. Она особенно сильна в профессиональной работе вроде синтеза и анализа информации, кодирования, а также в задачах с большим объемом документов — например, в исследованиях, особенно при использовании плагинов.

Ранние тестеры GPT-5.5 Pro сообщают о масштабном улучшении как качества, так и сложности работы, которую ChatGPT может брать на себя. Низкая задержка делает ее более практичной для требовательных задач, чем GPT-5.4 Pro. Ответы GPT-5.5 Pro хорошо структурированы, релевантны, полезны и точны, с особенно сильной производительностью в праве, data science, бизнесе и образовании.

Ценообразование и доступность

Хотя базовая версия доступна, самая мощная версия (GPT-5.5 Pro) стоит $100 в месяц для индивидуальных подписчиков. Для бизнеса стоимость за токен выходного ответа примерно вдвое выше, чем у GPT-5.4, даже с 40% более высокой эффективностью токенов. Общие расходы для крупномасштабных развертываний агентного типа могут быть значительными. Растет обеспокоенность тем, что самая высокая категория возможностей рассуждения станет «предметом роскоши», доступным только компаниям с хорошим финансированием, потенциально расширяя разрыв в продуктивности между крупными предприятиями и небольшими стартапами.

Посмотреть источник

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

комментарий

0/400

AprDaydream

· 3ч назад

Надеюсь, что официальные органы предоставят возможность проверки действий/воспроизведения, иначе при возникновении проблем будет трудно привлечь к ответственности, особенно в случае автоматического управления активами.

Посмотреть ОригиналОтветить0

PaperHandsPro

· 3ч назад

Реальное понимание намерений — это настоящая сложность, надеюсь, больше не будет неловких ситуаций, когда вы хотите забронировать билет, а он изменяет ваше резюме.

Посмотреть ОригиналОтветить0

Half-SectionedSucculent

· 3ч назад

Есть небольшое ожидание, и немного опасения: возможность щелкнуть мышью равносильно выполнению многих задач, которые требуют «человеческих кликов», поэтому системы управления рисками и антифрод должны быть усовершенствованы.

Посмотреть ОригиналОтветить0

ACalmnessWithAHintOfPomelo

· 3ч назад

Эта волна также повлияет на Web3, если автоматизированные операции в цепочке, процессы подписи и взаимодействие с кошельками смогут выполняться без швов, форма продукта изменится.

Посмотреть ОригиналОтветить0

StarsInTheGlassDome

· 3ч назад

API и цены пока не спешите, сначала посмотрите, сможет ли он выдержать всплывающие окна, многозадачность и сетевые колебания в сложной настольной среде.

Посмотреть ОригиналОтветить0

GateUser-b665e41c

· 3ч назад

Чувствуется, что эволюция идет от «умения говорить и писать» к «умению делать и сдавать», а следующий шаг — обеспечить ей лучшее запоминание и управление задачами.

Посмотреть ОригиналОтветить0

LintCollector

· 3ч назад

Если действительно возможно связать приложения: поиск информации в браузере → обработка в Excel → подготовка презентации в PPT → отправка по электронной почте, тогда это будет полный цикл работы в офисе.

Посмотреть ОригиналОтветить0

DegenWithNotebook

· 3ч назад

Наконец-то появилась нативная десктопная версия? Теперь действительно придется играть роль «цифрового стажера».

Посмотреть ОригиналОтветить0