OpenAI a officiellement publié GPT-5.5 le 23 avril 2026, un nouveau modèle d’IA conçu pour comprendre l’intention des utilisateurs dans des applications du monde réel grâce à des capacités natives d’utilisation de l’ordinateur. Le modèle présente des capacités natives polyvalentes lui permettant de naviguer dans des applications de bureau, de cliquer sur des boutons et de saisir du texte pour des flux de travail multi-étapes, selon l’annonce d’OpenAI.

GPT-5.5 combine l’utilisation native de l’ordinateur avec un raisonnement avancé, en naviguant de manière autonome dans les outils logiciels nécessaires pour des tâches professionnelles de haut niveau. La fenêtre de contexte du modèle, d’environ 1,1 million de tokens, lui permet de traiter d’immenses ensembles de données financières qui nécessitaient auparavant un découpage manuel. L’équipe financière d’OpenAI a utilisé GPT-5.5 pour examiner 24,771 formulaires fiscaux K-1 (71,637 pages) et a terminé la tâche deux semaines plus vite que l’année précédente.

Indicateurs de performance

GPT-5.5 a obtenu 88,5% sur des tâches internes de modélisation en banque d’investissement et 60% sur le benchmark FinancialAgent v1.1, surpassant GPT-5.4 de quatre points. Le modèle a atteint 84,9% sur GDPval, qui teste les capacités des agents à produire un travail de connaissance spécifique dans 44 professions. Sur OSWorld-Verified, mesurant les opérations autonomes sur ordinateur du modèle, il a atteint 78,7%. GPT-5.5 a marqué 98% sur le Tau2-bench Telecom, qui teste des flux de service client extrêmement difficiles.

Un employé de l’équipe Go-to-Market a confirmé que l’automatisation des rapports d’activité hebdomadaires permettra d’économiser environ 5 à 10 heures de travail manuel par semaine.

Génération de code et optimisation du système

OpenAI indique que GPT-5.5 a été utilisé pour aider à écrire du code pour sa propre infrastructure de service. Le modèle a atteint une « Optimisation au niveau du système » en analysant les schémas de trafic de production pour écrire des heuristiques de rééquilibrage de charge sur mesure, augmentant sa propre vitesse de génération de tokens de 20%.

Lors d’un test développeur, on a demandé au modèle de « re-architecturer un éditeur markdown » et il a renvoyé une pile de 12 diffs presque entièrement complète avec un minimum de corrections humaines. OpenAI note que le nouveau modèle atteint la bonne réponse en moins de tours et utilise 40% de tokens en moins pour les mêmes tâches Codex par rapport à GPT-5.4.

Dan Shipper, fondateur et PDG d’Every, a décrit GPT-5.5 comme le premier modèle de codage qui présente une « clarté conceptuelle sérieuse ». Shipper a testé GPT-5.5 après que lui et son meilleur ingénieur ont passé des jours à déboguer un problème post-lancement dans une application. D’après Shipper, GPT-5.5 a accompli ce que GPT-5.4 n’a pas réussi à faire : il a examiné le code défectueux et a produit la réécriture que l’ingénieur a finalement décidé d’adopter. Le modèle peut « mémoriser » et recouper des bibliothèques entières d’informations sans perdre sa place, réduisant les « hallucinations » qui avaient affecté les versions précédentes.

Capacités autonomes et auto-correction

OpenAI affirme que GPT-5.5 est optimisé pour la « auto-correction » et l’autonomie. Il est mieux à même d’interpréter des instructions ambiguës et d’utiliser une interface informatique (clicking, typing, browsing) pour atteindre des objectifs sans intervention humaine. Le modèle devient particulièrement utile lorsqu’un agent est nécessaire pour faire fonctionner un logiciel, gérer des flux de travail lourds en terminal, ou raisonner sur l’ensemble d’une base de code (500K+ tokens) avec une précision de récupération élevée.

Fonctionnalité de réflexion de GPT-5.5

Dans ChatGPT, OpenAI a introduit « GPT-5.5 Thinking », que l’entreprise dit permettre une aide plus rapide pour des problèmes plus difficiles. La fonctionnalité fournit des réponses plus intelligentes, plus concises, afin d’aider les utilisateurs à accomplir des tâches compliquées plus efficacement. Elle excelle dans le travail professionnel comme la synthèse et l’analyse d’informations, la programmation et les tâches riches en documents comme la recherche, en particulier lors de l’utilisation de plugins.

Les premiers testeurs de GPT-5.5 Pro rapportent une amélioration massive à la fois de la qualité et de la difficulté du travail que ChatGPT peut prendre en charge. Sa latence plus faible le rend plus pratique pour les tâches exigeantes que GPT-5.4 Pro. Les réponses de GPT-5.5 Pro sont bien structurées, pertinentes, utiles et exactes, avec des performances particulièrement solides en droit, en science des données, en affaires et dans l’éducation.

Tarification et accessibilité

Bien qu’une version de base soit disponible, la version la plus performante (GPT-5.5 Pro) coûte 100 $ par mois pour les abonnés individuels. Pour les entreprises, le coût par token de sortie est environ le double de celui de GPT-5.4, même avec une efficacité des tokens 40% plus élevée. Les dépenses totales pour des déploiements à grande échelle d’agents peuvent être considérables. Il existe une préoccupation croissante que le raisonnement du plus haut niveau devienne un « luxe », accessible uniquement aux entreprises bien financées, ce qui pourrait élargir l’écart de productivité entre les grandes entreprises et les plus petites startups.

Afficher la source

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Commentaire

0/400

AprDaydream

· Il y a 3h

J'espère que l'officiel fournira un mécanisme de journal d'action/relecture auditable, sinon il sera difficile de tenir pour responsable en cas de problème, surtout pour les comptes d'actifs gérés automatiquement.

Voir l'originalRépondre0

PaperHandsPro

· Il y a 3h

La « compréhension de l'intention » dans les applications réelles est le véritable défi, espérons qu'il n'y aura plus d'embarras où, lorsque vous souhaitez réserver un billet d'avion, il modifie votre CV à la place.

Voir l'originalRépondre0

Half-SectionedSucculent

· Il y a 3h

Un peu d'attente, et un peu de peur : pouvoir cliquer avec la souris équivaut à pouvoir faire beaucoup de choses que seul un « clic humain » peut réaliser, la gestion des risques et la lutte contre la fraude doivent être améliorées.

Voir l'originalRépondre0

ACalmnessWithAHintOfPomelo

· Il y a 3h

Cette vague aura également un impact sur le Web3, si l'automatisation des opérations en chaîne, le processus de signature et l'interaction avec le portefeuille pouvaient être réalisés de manière transparente, la forme du produit changerait.

Voir l'originalRépondre0

StarsInTheGlassDome

· Il y a 3h

API et les prix ne sont pas encore prioritaires, regardons d'abord s'il peut résister aux pop-ups, aux multi-fenêtres et aux fluctuations du réseau dans un environnement de bureau complexe.

Voir l'originalRépondre0

GateUser-b665e41c

· Il y a 3h

On a l'impression que l'évolution va de « savoir parler et écrire » à « savoir faire et livrer », la prochaine étape consiste à lui offrir une meilleure mémoire et une gestion des tâches améliorée.

Voir l'originalRépondre0

LintCollector

· Il y a 3h

Si cela pouvait vraiment s'interconnecter entre différentes applications : rechercher des informations dans le navigateur → traiter dans Excel → créer la présentation dans PowerPoint → envoyer par email, alors ce serait une boucle complète de processus de travail.

Voir l'originalRépondre0

DegenWithNotebook

· Il y a 3h

Enfin, une opération native sur le bureau ? Il va vraiment devoir devenir un « stagiaire numérique ».

Voir l'originalRépondre0