OpenAI a officiellement publié GPT-5.5 le 23 avril 2026, un nouveau modèle d’IA conçu pour comprendre l’intention des utilisateurs dans des applications du monde réel grâce à des capacités natives d’utilisation de l’ordinateur. Le modèle présente des capacités natives polyvalentes lui permettant de naviguer dans des applications de bureau, de cliquer sur des boutons et de saisir du texte pour des flux de travail multi-étapes, selon l’annonce d’OpenAI.
GPT-5.5 combine l’utilisation native de l’ordinateur avec un raisonnement avancé, en naviguant de manière autonome dans les outils logiciels nécessaires pour des tâches professionnelles de haut niveau. La fenêtre de contexte du modèle, d’environ 1,1 million de tokens, lui permet de traiter d’immenses ensembles de données financières qui nécessitaient auparavant un découpage manuel. L’équipe financière d’OpenAI a utilisé GPT-5.5 pour examiner 24,771 formulaires fiscaux K-1 (71,637 pages) et a terminé la tâche deux semaines plus vite que l’année précédente.
GPT-5.5 a obtenu 88,5% sur des tâches internes de modélisation en banque d’investissement et 60% sur le benchmark FinancialAgent v1.1, surpassant GPT-5.4 de quatre points. Le modèle a atteint 84,9% sur GDPval, qui teste les capacités des agents à produire un travail de connaissance spécifique dans 44 professions. Sur OSWorld-Verified, mesurant les opérations autonomes sur ordinateur du modèle, il a atteint 78,7%. GPT-5.5 a marqué 98% sur le Tau2-bench Telecom, qui teste des flux de service client extrêmement difficiles.
Un employé de l’équipe Go-to-Market a confirmé que l’automatisation des rapports d’activité hebdomadaires permettra d’économiser environ 5 à 10 heures de travail manuel par semaine.
OpenAI indique que GPT-5.5 a été utilisé pour aider à écrire du code pour sa propre infrastructure de service. Le modèle a atteint une « Optimisation au niveau du système » en analysant les schémas de trafic de production pour écrire des heuristiques de rééquilibrage de charge sur mesure, augmentant sa propre vitesse de génération de tokens de 20%.
Lors d’un test développeur, on a demandé au modèle de « re-architecturer un éditeur markdown » et il a renvoyé une pile de 12 diffs presque entièrement complète avec un minimum de corrections humaines. OpenAI note que le nouveau modèle atteint la bonne réponse en moins de tours et utilise 40% de tokens en moins pour les mêmes tâches Codex par rapport à GPT-5.4.
Dan Shipper, fondateur et PDG d’Every, a décrit GPT-5.5 comme le premier modèle de codage qui présente une « clarté conceptuelle sérieuse ». Shipper a testé GPT-5.5 après que lui et son meilleur ingénieur ont passé des jours à déboguer un problème post-lancement dans une application. D’après Shipper, GPT-5.5 a accompli ce que GPT-5.4 n’a pas réussi à faire : il a examiné le code défectueux et a produit la réécriture que l’ingénieur a finalement décidé d’adopter. Le modèle peut « mémoriser » et recouper des bibliothèques entières d’informations sans perdre sa place, réduisant les « hallucinations » qui avaient affecté les versions précédentes.
OpenAI affirme que GPT-5.5 est optimisé pour la « auto-correction » et l’autonomie. Il est mieux à même d’interpréter des instructions ambiguës et d’utiliser une interface informatique (clicking, typing, browsing) pour atteindre des objectifs sans intervention humaine. Le modèle devient particulièrement utile lorsqu’un agent est nécessaire pour faire fonctionner un logiciel, gérer des flux de travail lourds en terminal, ou raisonner sur l’ensemble d’une base de code (500K+ tokens) avec une précision de récupération élevée.
Dans ChatGPT, OpenAI a introduit « GPT-5.5 Thinking », que l’entreprise dit permettre une aide plus rapide pour des problèmes plus difficiles. La fonctionnalité fournit des réponses plus intelligentes, plus concises, afin d’aider les utilisateurs à accomplir des tâches compliquées plus efficacement. Elle excelle dans le travail professionnel comme la synthèse et l’analyse d’informations, la programmation et les tâches riches en documents comme la recherche, en particulier lors de l’utilisation de plugins.
Les premiers testeurs de GPT-5.5 Pro rapportent une amélioration massive à la fois de la qualité et de la difficulté du travail que ChatGPT peut prendre en charge. Sa latence plus faible le rend plus pratique pour les tâches exigeantes que GPT-5.4 Pro. Les réponses de GPT-5.5 Pro sont bien structurées, pertinentes, utiles et exactes, avec des performances particulièrement solides en droit, en science des données, en affaires et dans l’éducation.
Bien qu’une version de base soit disponible, la version la plus performante (GPT-5.5 Pro) coûte 100 $ par mois pour les abonnés individuels. Pour les entreprises, le coût par token de sortie est environ le double de celui de GPT-5.4, même avec une efficacité des tokens 40% plus élevée. Les dépenses totales pour des déploiements à grande échelle d’agents peuvent être considérables. Il existe une préoccupation croissante que le raisonnement du plus haut niveau devienne un « luxe », accessible uniquement aux entreprises bien financées, ce qui pourrait élargir l’écart de productivité entre les grandes entreprises et les plus petites startups.