OpenAI vient de faire une nouvelle annonce fracassante. Le jeudi 23 avril 2026, OpenAI a dévoilé GPT-5.5, son tout dernier modèle d'IA, qui, selon l'entreprise, est plus performant en programmation, en utilisation des ordinateurs et permet d'approfondir ses recherches. Cette version arrive à peine six semaines après la sortie de GPT-5.4, un rythme qui témoigne d'un changement fondamental dans la manière dont OpenAI conçoit et déploie l'IA de pointe.
Il ne s'agit pas d'une simple mise à jour. GPT-5.5 est un modèle sur lequel OpenAI fonde sa vision de « super application », et les premiers résultats confirment les attentes. Voici tout ce que vous devez savoir, des performances clés aux limitations réelles que personne ne met en avant.
Qu'est-ce que GPT-5.5 ?
GPT-5.5 est le modèle de codage et de raisonnement de pointe d'OpenAI, publié le 23 avril 2026. Il obtient un score de 88,7 % sur SWE-bench et de 92,4 % sur MMLU, avec une réduction de 60 % des hallucinations par rapport à GPT-5.4. Trois variantes sont disponibles : GPT-5.5 Standard, GPT-5.5 Thinking (raisonnement étendu) et GPT-5.5 Pro (précision maximale).
GPT-5.5 comprend plus rapidement vos objectifs et peut prendre en charge une plus grande partie du travail. Il excelle dans l'écriture et le débogage de code, la recherche en ligne, l'analyse de données, la création de documents et de feuilles de calcul, l'utilisation de logiciels et la navigation entre différents outils jusqu'à l'achèvement d'une tâche.
Le nom de code qui circule en ligne est "Patate" — un clin d'œil à l'emoji pomme de terre utilisé par OpenAI dans ses publications promotionnelles. Le nom est anodin ; le modèle, lui, ne l'est pas.
Argumentaire principal : Moins d’assistance, plus d’efficacité
L'argument principal mis en avant par OpenAI avec GPT-5.5 est l'autonomie. Le président d'OpenAI, Greg Brockman, l'a décrit ainsi : le modèle « Peut analyser un problème complexe et déterminer précisément les prochaines étapes à suivre. »
Lors d'une conférence de presse, Brockman a présenté GPT-5.5 comme une avancée vers une informatique plus « autonome et intuitive », la qualifiant de « véritable progrès vers le type d'informatique que nous attendons à l'avenir ». Selon OpenAI, GPT-5.5 est conçu pour gérer des tâches complexes et ambiguës avec moins d'intervention humaine que les modèles précédents. Concrètement, cela signifie que vous pouvez lui confier un problème vaste et complexe – un code source désordonné, une tâche de recherche aux contours flous, un flux de travail multi-outils – et lui faire confiance pour planifier, itérer et s'auto-corriger.
Fonctionnalités clés de GPT-5.5 : Analyse approfondie
1. Codage agentique — La capacité de titre
OpenAI affirme que GPT-5.5 est son modèle de programmation agentique le plus performant à ce jour. Sur Terminal-Bench 2.0, qui évalue les flux de travail complexes en ligne de commande, le modèle a obtenu un score de 82,7 %, contre 75,1 % pour GPT-5.4. Sur SWE-Bench Pro, qui évalue la résolution de problèmes GitHub en conditions réelles, il a atteint 58,6 %, et OpenAI indique qu'il a résolu davantage de tâches de bout en bout en une seule passe que les versions précédentes.
Pour situer ces chiffres dans leur contexte concurrentiel : Claude Opus 4.7 a obtenu un score de 69,4 % sur Terminal-Bench 2.0, soit plus de 13 points de pourcentage d’avance sur GPT-5.5. OpenAI a également utilisé GPT-5.5 sur sa propre infrastructure. Le LLM a contribué à l’optimisation du logiciel gérant cette infrastructure, une preuve de concept aussi originale que révélatrice.
2. Utilisation de l'ordinateur — Utilisation directe du logiciel d'exploitation
L'une des améliorations les plus sous-estimées de GPT-5.5 est sa capacité à naviguer de manière autonome dans les interfaces logicielles. OpenAI affirme que GPT-5.5 surpasse GPT-5.4 dans Codex pour la génération de documents, de feuilles de calcul et de présentations, et que ses compétences informatiques lui permettent de mieux passer d'un outil à l'autre, de vérifier les résultats et de naviguer dans les interfaces.
Il ne s'agit pas seulement de commodité. Pour les équipes d'entreprise gérant des flux de travail complexes, un modèle capable de véritablement « faire fonctionner » un logiciel — et non pas seulement de suggérer des actions à entreprendre — représente un progrès considérable.
Ce modèle représente un véritable pas en avant vers le type d'informatique que nous attendons à l'avenir, mais ce n'est qu'une étape, et nous nous attendons à en voir beaucoup d'autres à l'avenir.
— Greg Brockman, président d'OpenAI3. Recherche approfondie et découverte scientifique
Concernant les tâches de recherche, OpenAI indique que GPT-5.5 a amélioré GPT-5.4 sur GeneBench et a atteint 80,5 % sur BixBench, ce qu'elle décrit comme une performance de premier plan parmi les modèles ayant des scores publiés.
La découverte la plus marquante est la suivante : une version personnalisée de GPT-5.5 a permis aux chercheurs de mettre au jour une nouvelle démonstration impliquant les nombres de Ramsey hors diagonale, démonstration ultérieurement validée par Lean. Pour rappel, la théorie de Ramsey est un domaine de la combinatoire réputé pour sa complexité, avec des applications directes en informatique. Les découvertes mathématiques assistées par l’IA à ce niveau sont rares et significatives.
4. Raisonnement en contexte long
Sur le benchmark MRCR v2, qui teste la fiabilité avec laquelle un modèle peut localiser de multiples informations cachées dans de très longs textes, GPT-5.5 passe à 74,0% pour des longueurs de contexte de 512 000 à 1 million de jetons, contre 36,6 % pour GPT-5.4. Sur le test Graphwalks BFS avec un million de jetons, GPT-5.5 passe de 9,4 % (GPT-5.4) à 45,4 %.
Il ne s'agit pas d'améliorations mineures. Le doublement des performances en contexte long signifie que GPT-5.5 peut traiter des bases de code entières, de longs documents juridiques ou des archives de recherche pluriannuelles dans une seule fenêtre de contexte avec une fiabilité considérablement accrue.
5. Le travail du savoir dans toutes les professions
Sur GDPVal, un test de référence évaluant le travail intellectuel dans 44 professions réelles — de la finance à la recherche juridique en passant par la gestion de produits — GPT-5.5 égale ou surpasse les professionnels du secteur dans 84,9 % des comparaisons.
En interne, OpenAI indique que son équipe financière a utilisé Codex avec GPT-5.5 pour effectuer des analyses. 24 771 formulaires fiscaux K-1, soit 71 637 pagesce qui permet d'accélérer le processus de deux semaines par rapport à l'année précédente. Il ne s'agit pas d'un simple indicateur, mais d'un véritable gain de productivité à grande échelle.
GPT-5.5 vs GPT-5.4 : Principales différences en bref
| Métrique | GPT-5.4 | GPT-5.5 |
|---|---|---|
| Date de sortie | 5 mars 2026 | 23 avril 2026 |
| Terminal-Bench 2.0 | 75,1% | 82,7% |
| SWE-Bench Pro | 57,7% | 58,6% |
| MRCR v2 (512K–1M jetons) | 36,6% | 74,0% |
| PIBVal (travail intellectuel) | 83,0% | 84,9% |
| Prix d'entrée de l'API (par million de jetons) | 2,50 $ | 5,00 $ |
| Prix de sortie de l'API (par million de jetons) | 15,00 $ | 30,00 $ |
| Fenêtre contextuelle | 1 million de jetons | 1 million de jetons |
| Réduction des hallucinations | — | 60 % de moins par rapport à GPT-5.4 |
GPT-5.5 améliore 9 des 10 benchmarks par rapport directement à GPT-5.4, avec les gains les plus importants sur ARC-AGI-2, MCP Atlas et Terminal-Bench 2.0.
Tarification et accès : qui y a accès et combien ça coûte
GPT-5.5 est inclus dans les abonnements ChatGPT Plus (20 $/mois), Pro (200 $/mois), Business et Enterprise. Le prix de l'API a été annoncé, mais n'est pas encore disponible. 5 $ par million de jetons d'entrée et 30 $ par million de jetons de production Pour le modèle standard, le coût est deux fois plus élevé que pour GPT-5.4 (2,50 $/15 $). GPT-5.5 Pro est proposé à 30 $/180 $ par million, un tarif inchangé par rapport à GPT-5.4 Pro.
GPT-5.5 Thinking est disponible pour tous les abonnements payants, tandis que GPT-5.5 Pro est réservé aux abonnés Pro, Business et Enterprise. L'accès à Codex est inclus dans les formules Plus, Pro, Business, Enterprise, Edu et Go, avec une fenêtre de contexte de 400 000 caractères.
Le doublement du prix paraît excessif sur le papier. Mais OpenAI rétorque que GPT-5.5 est plus intelligent et bien plus économe en jetons, offrant de meilleurs résultats avec moins de jetons que GPT-5.4 pour la plupart des utilisateurs effectuant des tâches Codex. Pour les équipes gérant des flux de travail complexes impliquant plusieurs agents, l'impact sur les coûts pourrait être moins important que ne le laisse supposer le prix affiché.
Applications concrètes : les points forts de GPT-5.5
Pour les développeurs et les équipes d'ingénierie : Les gains apportés par SWE-bench et Terminal-Bench se traduisent directement par un débogage plus rapide, une navigation plus fluide dans le code source et une réduction des interventions humaines dans les boucles d'agents. Si vous utilisez un pipeline de développement automatisé, cette mise à niveau est essentielle.
Pour les professionnels du droit et de la finance : GPT-5.5 Pro offre des gains de qualité particulièrement importants dans les domaines des affaires, du droit, de l'éducation et des sciences des données. L'exemple du formulaire fiscal K-1 — 71 637 pages traitées en deux semaines — illustre concrètement le gain d'efficacité réalisé.
Pour les chercheurs : La preuve du nombre de Ramsey, les améliorations de GeneBench et les scores de BixBench positionnent GPT-5.5 comme un véritable co-chercheur pour le travail scientifique — et non pas seulement comme un outil de synthèse.
Pour les travailleurs du savoir en entreprise : Plus de 10 000 employés de NVIDIA, issus des services d'ingénierie, de produit, juridiques, marketing, financiers, commerciaux, RH et opérationnels, ont bénéficié d'un accès anticipé et ont qualifié les résultats d'« époustouflants » et de « révolutionnaires ». Il s'agit d'une approbation interne exceptionnellement forte.
Là où GPT-5.5 ne gagne pas
Un compte rendu honnête d'un nouveau modèle nécessite de reconnaître où la concurrence conserve ses atouts.
Sur SWE-Bench Pro, Claude Opus 4.7 surpasse GPT-5.5 GPT-5.5 obtient 64,3 % contre 58,6 % sur MCP Atlas, avec un score de 75,3 %, inférieur à celui de Claude Opus 4.7 (79,1 %) et de Gemini 3.1 Pro (78,2 %). Sur BrowseComp, un outil d'évaluation des performances en recherche web, GPT-5.5 est également légèrement en retrait par rapport à Gemini, avec 84,4 % contre 85,9 %.
Sur GDPval, GPT-5.5 obtient un score de 84,9 %, soit une amélioration marginale par rapport aux 83,0 % de GPT-5.4, ce qui suggère que pour les tâches professionnelles quotidiennes, l'écart de performance par rapport à la génération précédente peut être plus faible que ce que les gros titres laissent entendre.
Faut-il mettre à niveau ? Un cadre de décision
Mettez à niveau maintenant si…
- Vous exécutez des pipelines de codage automatisés ou utilisez Codex de manière intensive.
- Vous travaillez avec des documents contenant plus de 500 000 jetons.
- Votre cas d'utilisation implique une interaction informatique en plusieurs étapes.
- Vous menez des recherches qui nécessitent un raisonnement approfondi et itératif.
Utilisez GPT-5.4 si…
- Charges de travail à volume élevé et à faible complexité (classification, synthèse)
- Sensible aux coûts et atteignant déjà les limites de GPT-5.4
- Utilisation de l'outil principalement requise via MCP Atlas, sous la direction de Claude/Gemini
- Développement d'applications grand public : attendez de réaliser des tests A/B sur le trafic de production.
Vue d'ensemble : le problème (et l'opportunité) de la vélocité d'OpenAI
Cette annonce intervient moins de deux mois après la sortie de GPT-5.4 par OpenAI, un délai qui souligne la rapidité d'évolution du secteur de l'IA et l'intensité de la concurrence entre les plus grands acteurs du secteur. Ce lancement survient quelques semaines seulement après la présentation par Anthropic de Claude Mythos Preview, son nouveau modèle doté de fonctionnalités avancées de cybersécurité ; un rappel que la sortie de GPT-5.5 est autant une question de timing concurrentiel que de maturité technique.
Brockman a présenté GPT-5.5 comme une étape vers la vision d'OpenAI d'une « super application » : une interface intelligente unique gérant de bout en bout le travail intellectuel, la programmation, la recherche et l'exploitation du logiciel. Reste à savoir si cette vision sera réalisable en 2026. Cependant, le rythme des mises à jour – GPT-5, 5.1, 5.2, 5.3-Codex, 5.4 et maintenant 5.5 en moins de neuf mois – laisse penser qu'OpenAI construit quelque chose de bien plus vaste que n'importe quel modèle individuel.
Foire aux questions
GPT-5.5 est le modèle d'IA de pointe d'OpenAI, sorti le 23 avril 2026. Il est conçu pour la programmation d'agents, l'utilisation d'ordinateurs, la recherche approfondie et le travail intellectuel, et est disponible en trois versions : standard, Thinking et Pro.
GPT-5.5 améliore considérablement le raisonnement sur des contextes longs, les performances en ligne de commande et en programmation, ainsi que la réduction des hallucinations (60 % d'erreurs en moins par rapport à GPT-5.4), tout en conservant la même latence par jeton que GPT-5.4. En contrepartie, le prix de l'API est deux fois plus élevé.
Via l'API : 5 $ par million de jetons d'entrée et 30 $ par million de jetons de sortie. GPT-5.5 Pro coûte 30 $/180 $ par million de jetons. Il est inclus sans frais supplémentaires dans les abonnements ChatGPT Plus, Pro, Business et Enterprise.
Non. La version GPT-5.5 est actuellement déployée uniquement auprès des abonnés payants de ChatGPT (Plus, Pro, Business et Enterprise). L'accès pour la version gratuite n'a pas encore été annoncé.
Sur les benchmarks de programmation comme Terminal-Bench 2.0 et les tâches d'agents, GPT-5.5 est en tête. Sur les benchmarks d'utilisation d'outils SWE-Bench Pro et MCP Atlas, Claude Opus 4.7 et Gemini 3.1 Pro présentent des avantages compétitifs. Aucun modèle ne domine tous les benchmarks.
OpenAI a annoncé ses tarifs, mais précise que le déploiement de l'API aura lieu « très prochainement », à compter du 23 avril 2026.
GPT-5.5 est le modèle le plus performant qu'OpenAI ait proposé à ce jour sur les benchmarks essentiels pour les tâches automatisées à long terme ; le gain de performance lié au contexte long est considérable. Son prix, deux fois supérieur à celui de l'API, justifie une analyse approfondie avant tout déploiement à grande échelle. Cependant, pour les équipes se consacrant à la programmation, à la recherche ou à l'automatisation des tâches informatiques, l'amélioration des capacités est réelle et mesurable.
Le rythme des progrès est ici sous-jacent. Nous vivons à une époque où les modèles d'IA de pointe évoluent par cycles de six semaines. Cela modifie la façon dont les développeurs, les entreprises et les particuliers doivent concevoir leur infrastructure d'IA : non plus comme un choix statique, mais comme une décision évolutive qui nécessite un réexamen constant.
GPT-5.5 n'est pas la ligne d'arrivée. C'est, comme l'a dit Brockman, une étape.
Sources
Annonce officielle d'OpenAI · CNBC · TechCrunch · The Decoder · SiliconAngle · iClarified · Blog NVIDIA · Artificial Analysis · llm-stats.com


Se connecter














