O primeiro AI a criar outro AI na história! GPT-5.3 participa no seu próprio desenvolvimento, a ficção científica torna-se realidade

MarketWhisper

A OpenAI lançou o GPT-5.3-Codex, o primeiro modelo que “participa na sua própria criação” para depurar o seu próprio código, gerir a implementação e diagnosticar testes. Karpathy classificou a revisão como “a mais próxima da cena de descolagem da IA.”

A IA começou a criar singularidades tecnológicas e avanços na IA

Conta oficial da OpenAI lançada: GPT-5.3-Codex é oficialmente lançada, sendo “a primeira a participar na criação do seu próprio modelo”. O que significa? Por outras palavras, durante o processo de desenvolvimento, esta IA ajudou a depurar o seu próprio código de treino, gerir o seu próprio processo de implementação e diagnosticar os seus próprios resultados de teste. Em termos humanos, a IA começou a criar IA.

Andrej Karpathy, antigo investigador da OpenAI e diretor da Tesla AI, tuitou logo após a ler: “Isto é a coisa mais próxima que alguma vez vi de uma cena de descolagem de IA na ficção científica.” Esta avaliação dos principais investigadores em IA é relevante porque Karpathy experienciou pessoalmente várias fases-chave do desenvolvimento da IA, e o seu julgamento baseia-se num profundo conhecimento técnico.

A IA itera sobre si própria, isto não é retórica de marketing. De acordo com a divulgação interna da OpenAI, o GPT-5.3-Codex fez estas coisas durante o processo de desenvolvimento: analisar testes que não assinalaram registos de treino, sugerir correções para scripts e perfis de treino, gerar receitas de implementação e resumir e avaliar anomalias para revisão humana. O que é que isto significa? A IA já não é apenas uma ferramenta, está a começar a fazer parte da equipa de desenvolvimento, e é do tipo que pode melhorar-se.

Esta capacidade de participar no desenvolvimento ultrapassa o posicionamento tradicional da IA. No passado, os modelos de IA eram concebidos, treinados e implementados inteiramente por humanos, e a IA era um produto passivo. Agora, o GPT-5.3 desempenhou um papel ativo no seu próprio nascimento e, embora ainda sob supervisão humana, esta mudança de papel tem implicações de grande alcance. Isto sugere uma possibilidade: os modelos futuros de IA poderão ser largamente desenhados e otimizados pela própria IA, com os humanos a fornecer apenas orientação e revisão final.

Auto-participação no desenvolvimento do GPT-5.3

Analisar registos de treino: Sinaliza automaticamente os testes falhados para identificar anomalias durante o treino

Plano de reparação recomendado: Sugerir melhorias nos scripts e perfis de treino

Gerar a receita de implementação: Automatizar o processo de implementação e reduzir operações manuais

Anomalia da avaliação sumária: Organizar resultados complexos de avaliações em relatórios compreensíveis para humanos

Um artigo recente da SEAL publicado pelo MIT (arXiv:2506.10943) descreve uma arquitetura de IA que aprende continuamente após a implementação, evoluindo sem re-treino. Notavelmente, alguns investigadores SEAL juntaram-se agora à OpenAI. Isto significa que a IA passou de uma “ferramenta estática” para um “sistema dinâmico”, a aprendizagem já não é interrompida na implementação, e as fronteiras entre inferência e treino estão a derreter-se. O GPT-5.3 pode ser a primeira aplicação comercial desta nova arquitetura.

77,3% esmagaram o massacre de referência de Claude

A 5 de fevereiro, a OpenAI e a Anthropic lançaram ambas uma nova geração de modelos com apenas 20 minutos de intervalo. Primeiro, a Anthropic lançou o Claude Opus 4.6, e depois a OpenAI lançou o GPT-5.3-Codex. Como a OpenAI quer usar o GPT-5.3-Codex para eliminar os novos modelos de outras pessoas, deve ter alguma capacidade. Os dados não mentem, o GPT-5.3-Codex estabeleceu novos recordes em vários benchmarks da indústria assim que foi lançado.

O Terminal-Bench 2.0 testa as capacidades operacionais da IA num ambiente real de terminal, compilando código, treinando modelos e configurando servidores. O GPT-5.3-Codex obteve 77,3%, enquanto o GPT-5.2-Codex teve apenas 64,0% e o Claude Opus 4.6 reportou 65,4%. Isto representa um aumento de 13 pontos percentuais entre gerações, o que já representa um enorme avanço no campo da IA. A comparação entre 77,3% e 65,4% mostra que o GPT-5.3 estabelece uma vantagem significativa em tarefas de engenharia do mundo real.

O SWE-Bench Pro é um benchmark especificamente concebido para testar capacidades reais de engenharia de software, abrangendo quatro linguagens de programação: Python, JavaScript, Go e Ruby. O GPT-5.3-Codex obteve 56,8%, superando os 56,4% do seu antecessor, o GPT-5.2-Codex, e continuou a manter o seu primeiro lugar na indústria. Mais importante ainda, a OpenAI revelou que o GPT-5.3-Codex utiliza o menor número de tokens de saída de qualquer modelo quando atinge esta pontuação, o que significa que não só é preciso, mas também eficiente.

O OSWorld-Verified testa a capacidade da IA para realizar tarefas de produtividade num ambiente de ambiente visual desktop, editando folhas de cálculo, criando apresentações, trabalhando em documentos e muito mais. O GPT-5.3-Codex obteve 64,7%, comparado com a média humana de 72%. Isto significa que atingiu o desempenho das pessoas comuns em tarefas de operação informática, quase duplicando o desempenho do seu antecessor. Este desempenho quase humano torna a IA verdadeiramente capaz de trabalhar em escritório pela primeira vez, em vez de ser apenas uma ferramenta auxiliar.

O Claude contraria equipas de 100K de Tokens e Agentes

O que é ainda mais notável é que o Claude Opus 4.6 suporta, pela primeira vez, uma janela de contexto de token (beta) de 100K no modelo ao nível Opus, que pode processar toda a base de código ou centenas de páginas de documentos de uma só vez, e lançou a função Agent Teams, onde vários agentes de IA podem colaborar na programação, teste e escrita de documentos ao mesmo tempo.

Quando a OpenAI e a Anthropic lançam os seus modelos emblemáticos no mesmo dia e no mesmo momento, esta competição deixa de ser apenas uma competição técnica, mas uma batalha sobre a futura configuração da IA: a rota da “auto-evolução” da OpenAI ou a rota da “colaboração multi-agente” da Anthropic? A estratégia da OpenAI é tornar uma única IA mais poderosa e até melhorar-se a si própria. A estratégia da Anthropic é permitir que múltiplas IAs colaborem em tarefas complexas através da divisão de tarefas e colaboração.

O contexto dos tokens de 100K é um avanço tecnológico. Isto equivale a cerca de 75 milhões de palavras em inglês ou 300 caracteres chineses, o que é suficiente para caber todo o código de um projeto de software de média dimensão ou uma documentação técnica espessa. Esta capacidade permite a Claude “ver” o projeto completo em vez de uma compreensão fragmentária. Para a análise de arquitetura e refatoração de projetos de grande escala, esta visão global é crucial.

A Agent Teams traz o conceito de colaboração para a IA. Um Agente escreve código, outro testa e um terceiro escreve documentação, podendo comunicar e coordenar-se entre si. Este padrão imita o funcionamento das equipas humanas de software e pode ser mais adequado para certos cenários do que uma única superIA. No entanto, a colaboração entre múltiplos agentes também introduz novas complexidades: como coordenar, como evitar conflitos e como garantir consistência.

Ambas as rotas têm as suas vantagens e desvantagens. A rota de auto-evolução da OpenAI é mais agressiva e, se for bem-sucedida, pode levar a melhorias exponenciais nas capacidades, mas também pode sair do controlo. A via multi-agente da Anthropic é mais conservadora, reduzindo um ponto único de risco ao espalhar capacidades, mas os custos de coordenação podem limitar a eficiência. À medida que a IA começa a evoluir na natureza, as questões de governação vão passar de “quão inteligente é” para “como gerimos um sistema que está em constante mudança?” E quando duas das principais empresas de IA lançam modelos inovadores consecutivos em 20 minutos, a janela de tempo restante para o pensamento e preparação humana está a diminuir a uma velocidade visível a olho nu.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

PayPal e TCS apresentam rede blockchain para acelerar pagamentos de frete

PayPal e TCS Blockchain introduziram uma rede de liquidação em blockchain para acelerar os pagamentos na indústria do transporte rodoviário. Ao usar o stablecoin PayPal USD, as faturas de frete podem ser liquidadas quase instantaneamente, melhorando a liquidez para os transportadores e reduzindo os custos em até 90%. O sistema visa melhorar a transparência e a eficiência nas finanças logísticas.

CryptometerIo12m atrás

Turbulência geopolítica! Dalio clama que "o ouro é o único verdadeiro Deus", mas o seu desempenho de proteção contra riscos ficou atrás do Bitcoin

Na escalada da tensão geopolítica no Médio Oriente, o fundador da Bridgewater, Dalio, questiona o Bitcoin e reafirma o ouro como a principal reserva de valor. Apesar disso, o preço do ouro caiu em resposta, enquanto o Bitcoin apenas sofreu uma correção ligeira, indicando que a correlação entre os dois está a diminuir. Dalio duvida da transparência do Bitcoin e dos riscos futuros, mas ainda mantém uma pequena alocação em Bitcoin para diversificação de ativos.

区块客21m atrás

ETH 15 minutos de queda rápida de 1,53%: a combinação de redução de posições por grandes investidores a curto prazo e a saída de fundos de ETF desencadeou uma queda de volume

2026-03-06 13:45 até 2026-03-06 14:00 (UTC), o preço do ETH apresentou uma mudança significativa, com uma queda de 1,53% no curto prazo, e o preço oscilou intensamente na faixa de 2019,21 a 2051,26 USDT, com uma amplitude de 1,56%. Ordens de venda de alta frequência concentraram-se, a atenção do mercado aumentou rapidamente, o volume de negociações expandiu-se, as divergências entre compradores e vendedores intensificaram-se, e o sentimento do mercado tornou-se mais cauteloso. A principal força motriz desta mudança foi a concentração de grandes investidores e contas de baleias a reduzirem posições após uma recuperação de curto prazo, levando à rápida liberação de ordens de venda elevadas, o que acionou uma pressão de venda de curto prazo no mercado. No nível do ETF, a manutenção

GateNews23m atrás

BTC em queda de curto prazo de 1,23%: saída de fundos de baleias e liquidação de posições longas alavancadas provocam venda concentrada

2026-03-06 13:45 às 14:00 (UTC), o preço do Bitcoin (BTC) registou uma taxa de retorno de -1.23% em 15 minutos, com uma faixa de preço de 69219.0 a 70086.3 USDT, atingindo uma amplitude de 1.24%. A atividade de negociação aumentou significativamente num curto período, com o mercado focado em oscilações acentuadas e o aumento do sentimento de risco. A principal força motriz desta movimentação foi a contínua saída de fundos de grandes baleias na cadeia e o encerramento em massa de posições longas alavancadas no mercado de derivativos. De acordo com dados on-chain, o volume de retiradas de grandes baleias atingiu até 16972 BTC num único dia, Whales O

GateNews23m atrás

Aviso de subida do TradFi: VIX aumentou mais de 7,5%

Bot de Notícias da Gate informa que, de acordo com os dados mais recentes da Gate TradFi, o VIX subiu 7,5% a curto prazo, com a amplitude de volatilidade atual claramente acima do nível médio recente, indicando um aumento na atividade do mercado.

GateNews45m atrás

Os dados de emprego não agrícola dos EUA ficaram abaixo do esperado, o ouro à vista subiu mais de 40 dólares, e o índice do dólar caiu mais de 20 pontos

Gate News mensagem, a 6 de março, após a divulgação dos dados de emprego não agrícola dos EUA, que ficaram abaixo do esperado, o ouro à vista subiu mais de 40 dólares no curto prazo, atualmente cotado a 5112 dólares por onça; a prata à vista subiu 1,6 dólares no curto prazo, atualmente cotada a 83,85 dólares por onça; o índice do dólar DXY (que mede a força do dólar em relação a uma cesta de moedas) caiu mais de 20 pontos no curto prazo, atualmente cotado a 99,14.

GateNews52m atrás
Comentário
0/400
Sem comentários