A OpenAI lançou oficialmente o GPT-5.5 em 23 de abril de 2026, um novo modelo de IA projetado para entender a intenção do usuário em aplicações do mundo real por meio de capacidades nativas de uso de computador. O modelo apresenta capacidades nativas de uso geral que permitem que ele navegue em aplicativos de desktop, clique em botões e digite texto para fluxos de trabalho de várias etapas, de acordo com o anúncio da OpenAI.

O GPT-5.5 combina uso nativo de computador com raciocínio avançado, navegando de forma autônoma pelas ferramentas de software necessárias para tarefas profissionais de alto nível. A janela de contexto de ~1,1 milhão de tokens do modelo permite que ele processe enormes conjuntos de dados financeiros que antes exigiam segmentação manual. A equipe financeira da OpenAI usou o GPT-5.5 para revisar 24.771 formulários fiscais K-1 (71.637 páginas) e concluiu a tarefa duas semanas mais rápido do que no ano anterior.

Métricas de Desempenho

O GPT-5.5 obteve 88,5% em tarefas internas de modelagem para banco de investimento e 60% no benchmark FinancialAgent v1.1, superando o GPT-5.4 em quatro pontos. O modelo atingiu 84,9% no GDPval, que testa a capacidade dos agentes de produzir trabalho de conhecimento específico em 44 ocupações. No OSWorld-Verified, que mede as operações autônomas reais do computador do modelo, ele chegou a 78,7%. O GPT-5.5 marcou 98% no Tau2-bench Telecom, que testa fluxos de trabalho extremamente difíceis de atendimento ao cliente.

Um funcionário da equipe Go-to-Market confirmou que automatizar relatórios semanais de negócios economizará aproximadamente 5-10 horas de trabalho manual por semana.

Geração de Código e Otimização de Sistema

A OpenAI relata que o GPT-5.5 foi usado para ajudar a escrever código para sua própria infraestrutura de atendimento. O modelo obteve “Otimização no Nível do Sistema” ao analisar padrões de tráfego de produção para escrever heurísticas personalizadas de balanceamento de carga, aumentando sua própria velocidade de geração de tokens em 20%.

Em um teste para desenvolvedores, o modelo foi solicitado a “re-estruturar um editor de markdown” e retornou uma pilha de 12 diffs quase completa com correção humana mínima. A OpenAI observa que o novo modelo chega à resposta correta em menos turnos e usa 40% menos tokens para as mesmas tarefas do Codex em comparação ao GPT-5.4.

Dan Shipper, fundador e CEO da Every, descreveu o GPT-5.5 como o primeiro modelo de codificação que tem “clareza conceitual séria”. Shipper testou o GPT-5.5 depois que ele e seu melhor engenheiro passaram dias depurando um problema pós-lançamento em um app. De acordo com Shipper, o GPT-5.5 alcançou o que o GPT-5.4 não conseguiu: ele examinou o código quebrado e produziu a reescrita que o engenheiro eventualmente decidiu. O modelo pode “lembrar” e fazer referência cruzada a bibliotecas inteiras de informações sem perder seu lugar, reduzindo as “alucinações” que assombravam versões anteriores.

Capacidades Autônomas e Auto-Correção

A OpenAI afirma que o GPT-5.5 é otimizado para “auto-correção” e autonomia. Ele é melhor em interpretar instruções ambíguas e usar uma interface de computador (clicando, digitando, navegando) para concluir objetivos sem intervenção humana. O modelo se torna particularmente útil quando um agente é necessário para operar software, gerenciar fluxos de trabalho mais pesados no terminal, ou raciocinar por meio de uma base de código inteira (500K+ tokens) com alta precisão de recuperação.

Recurso de Pensamento do GPT-5.5

No ChatGPT, a OpenAI introduziu o “GPT-5.5 Thinking”, que a empresa diz desbloquear ajuda mais rápida para problemas mais difíceis. O recurso fornece respostas mais inteligentes, mais concisas, para ajudar os usuários a concluir tarefas complicadas de forma mais eficiente. Ele se destaca em trabalhos profissionais como síntese e análise de informações, codificação, e tarefas com muitos documentos como pesquisa, especialmente ao usar plugins.

Testadores Pro iniciais do GPT-5.5 relatam uma melhoria massiva tanto na qualidade quanto na dificuldade do trabalho que o ChatGPT pode assumir. A baixa latência o torna mais prático para tarefas exigentes do que o GPT-5.4 Pro. As respostas do GPT-5.5 Pro são bem estruturadas, relevantes, úteis e precisas, com desempenho particularmente forte em direito, ciência de dados, negócios e educação.

Preços e Acessibilidade

Embora uma versão básica esteja disponível, a versão mais capaz (GPT-5.5 Pro) custa US$ 100/mês para assinantes individuais. Para empresas, o custo por token de saída é aproximadamente o dobro do do GPT-5.4, mesmo com 40% a mais de eficiência de tokens. O gasto total para implantações agentic em grande escala pode ser substancial. Há uma preocupação crescente de que o raciocínio de maior nível se torne um “luxo” acessível apenas a empresas bem financiadas, potencialmente ampliando a lacuna de produtividade entre grandes empresas e start-ups menores.

Ver fonte

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Comentário

0/400

AprDaydream

· 3h atrás

Espero que as autoridades forneçam um mecanismo de registro de ações/audição auditável, caso contrário, será difícil responsabilizar alguém em caso de problemas, especialmente em contas de ativos operadas automaticamente.

Ver originalResponder0

PaperHandsPro

· 3h atrás

A "compreensão de intenção" na aplicação prática é realmente o ponto difícil, espero que não volte a acontecer aquela situação constrangedora de você querer reservar um voo e ela alterar seu currículo.

Ver originalResponder0

Half-SectionedSucculent

· 3h atrás

Estou um pouco ansioso, e um pouco assustado: poder clicar com o mouse equivale a fazer muitas das coisas que só podem ser feitas com "cliques humanos", então o controle de risco e a luta contra fraudes precisam ser aprimorados.

Ver originalResponder0

ACalmnessWithAHintOfPomelo

· 3h atrás

Essa onda também impacta o Web3, né? Se operações automatizadas na cadeia, processos de assinatura e interações com carteiras puderem ser feitos de forma fluida, a forma do produto vai mudar.

Ver originalResponder0

StarsInTheGlassDome

· 3h atrás

API e preços, primeiro não se apresse, primeiro veja se ele consegue resistir a janelas pop-up, múltiplas janelas e oscilações de rede em ambientes desktop complexos.

Ver originalResponder0

GateUser-b665e41c

· 3h atrás

Sentir a evolução de "saber falar e escrever" para "saber fazer e entregar", o próximo passo é fornecer a ela uma memória melhor e gerenciamento de tarefas.

Ver originalResponder0

LintCollector

· 3h atrás

Se realmente for possível conectar entre aplicativos: pesquisar no navegador → processar no Excel → criar apresentação no PPT → enviar por e-mail, então será um ciclo completo de fluxo de trabalho de escritório.

Ver originalResponder0

DegenWithNotebook

· 3h atrás

Finalmente chegou à operação nativa na área de trabalho? Agora realmente vai ser um "estagiário digital".

Ver originalResponder0