GPT-5.4 est décliné en deux versions principales : GPT-5.4 Thinking et GPT-5.4 Pro. Ces deux variantes reposent sur la même architecture mais se distinguent par leurs performances, leur vitesse et leur tarification.
L’une des avancées majeures du modèle réside dans l’intégration des capacités de programmation issues de GPT-5.3-Codex, combinées à un système de raisonnement plus robuste. Concrètement, le modèle peut analyser des problèmes complexes, structurer un raisonnement en plusieurs étapes et produire du code exécutable dans différents langages.
Cette évolution s’inscrit dans une tendance observée dans l’ensemble du secteur : les modèles d’IA ne sont plus seulement des assistants conversationnels, mais deviennent progressivement des agents capables de produire des livrables professionnels.
Dans ce domaine, GPT-5.4 vise particulièrement les usages liés à l’ingénierie logicielle, à l’analyse de données ou encore à la modélisation financière.
Une IA capable d’interagir avec un ordinateur
L’une des innovations les plus marquantes de GPT-5.4 concerne la capacité du modèle à interagir directement avec un environnement informatique. Grâce à un système de “computer use”, l’IA peut analyser des captures d’écran, naviguer dans une interface, cliquer sur des éléments ou saisir du texte dans différents logiciels.
Autrement dit, GPT-5.4 ne se limite plus à produire des instructions ou du code. Il peut également exécuter une chaîne d’actions sur un poste de travail, comme le ferait un utilisateur humain.
Les performances observées sur certains benchmarks illustrent ce changement. Sur OSWorld-Verified, un test évaluant la capacité d’un agent à accomplir des tâches dans un environnement informatique, GPT-5.4 atteint 75 % de réussite, contre 47,3 % pour GPT-5.2 et environ 72,4 % pour les opérateurs humains testés1.
Ces résultats montrent que les modèles d’IA commencent à atteindre un niveau de performance comparable à celui d’un utilisateur humain dans certaines tâches numériques structurées.
Des performances en hausse dans les tâches professionnelles
Les progrès les plus visibles apparaissent dans les scénarios liés au travail de bureau. Sur l’indicateur GDPval, qui mesure la capacité d’un modèle à produire des livrables professionnels dans 44 métiers différents, GPT-5.4 obtient un score de 83 %, contre 70,9 % pour GPT-5.2.
Dans les exercices de modélisation financière, comparables à ceux réalisés par un analyste junior en banque d’investissement, le modèle atteint 87,3 % de réussite, soit une progression notable par rapport aux versions précédentes.
OpenAI indique également que la fiabilité des réponses s’améliore sensiblement. Le modèle produirait 33 % d’affirmations fausses en moins et 18 % d’erreurs factuelles en moins que GPT-5.22.
Du côté de la programmation, l’amélioration est plus modérée. Sur le benchmark SWE-Bench Pro, GPT-5.4 obtient 57,7 %, contre 56,8 % pour GPT-5.3-Codex. La différence se situe davantage dans la vitesse et la stabilité du modèle, notamment grâce à un nouveau mode “/fast” qui accélère la génération de tokens d’environ 50 %.
Tool Search et une fenêtre de contexte géante
GPT-5.4 introduit également une nouvelle approche pour gérer les outils externes. Le système baptisé Tool Search permet au modèle de charger uniquement les outils nécessaires à une tâche donnée, plutôt que d’injecter l’ensemble des définitions d’outils dans le prompt initial.
Cette stratégie réduit considérablement la consommation de tokens. Sur certaines évaluations internes, OpenAI indique une réduction moyenne de 47 % des tokens utilisés, sans perte de précision dans l’exécution des tâches.
Autre évolution notable : GPT-5.4 prend en charge une fenêtre de contexte expérimentale pouvant atteindre un million de tokens via l’API et l’environnement Codex. Cette capacité permet d’analyser de grands volumes d’informations, comme des bases de code complètes ou des documents volumineux.
Accès, disponibilité et calendrier de déploiement
GPT-5.4 est déjà accessible dans l’écosystème OpenAI, mais son déploiement se fait de manière progressive. La version GPT-5.4 Thinking est disponible pour les abonnés ChatGPT Plus, Team et Pro, tandis que GPT-5.4 Pro est réservé aux plans Pro et Enterprise.
Le modèle est accessible dans les environnements ChatGPT et via l’API OpenAI. Les développeurs peuvent également l’utiliser dans des outils liés à l’écosystème Codex et dans certaines intégrations professionnelles.
Du point de vue géographique, l’accès au modèle est global, ce qui signifie qu’il peut être utilisé aussi bien aux États-Unis qu’en Europe, y compris en France, sous réserve des conditions d’abonnement et de disponibilité des services OpenAI.
Les utilisateurs peuvent consulter les informations détaillées et accéder à la documentation technique directement sur le site officiel : https://openai.com
GPT-5.2 Thinking restera disponible comme modèle hérité jusqu’au 5 juin 2026, le temps que les utilisateurs migrent vers la nouvelle version.
Une tarification plus élevée mais plus efficace
Comme souvent avec les nouveaux modèles d’IA, les performances supplémentaires s’accompagnent d’une hausse des coûts.
GPT-5.4 est facturé 2,50 dollars par million de tokens en entrée et 15 dollars par million de tokens en sortie, contre respectivement 1,75 dollar et 14 dollars pour GPT-5.2.
La version GPT-5.4 Pro, destinée aux usages intensifs et aux entreprises, atteint 30 dollars par million de tokens en entrée et 180 dollars en sortie.
OpenAI justifie cette augmentation par une meilleure efficacité globale du modèle. Selon l’entreprise, GPT-5.4 nécessiterait moins de tokens pour résoudre une tâche équivalente, ce qui pourrait réduire le coût total dans certains cas d’usage.
Une nouvelle étape dans la course aux modèles avancés
Le lancement de GPT-5.4 intervient dans un contexte de concurrence intense entre les principaux acteurs de l’intelligence artificielle. Au début de l’année 2026, Anthropic a présenté Claude Opus 4.6, tandis que Google a introduit Gemini 3.1 Pro.
Ces annonces successives illustrent le rythme particulièrement rapide de l’innovation dans le domaine des modèles de langage. Les cycles de lancement se comptent désormais en semaines plutôt qu’en années.
Dans cette dynamique, GPT-5.4 représente moins une rupture technologique isolée qu’une étape supplémentaire dans la transformation des modèles d’IA en véritables agents logiciels capables de raisonner, programmer et agir dans des environnements numériques complexes.
Enjeux éthiques et limites technologiques
Malgré les progrès rapides des modèles d’IA, leur intégration dans les environnements professionnels soulève plusieurs questions. Les systèmes capables d’interagir directement avec un ordinateur ou de produire des livrables techniques peuvent amplifier les gains de productivité, mais ils posent également des défis en matière de supervision humaine et de responsabilité.
La capacité d’un agent IA à exécuter des actions sur un poste de travail nécessite par exemple des mécanismes de contrôle stricts afin d’éviter des erreurs critiques ou des comportements inattendus. Les questions de sécurité informatique et de gestion des accès deviennent alors centrales.
Par ailleurs, les performances observées dans les benchmarks ne garantissent pas toujours une fiabilité parfaite dans des environnements réels. Les modèles peuvent encore produire des erreurs logiques, des hallucinations ou des interprétations incorrectes de certaines instructions.
Dans ce contexte, l’intégration de l’IA dans les organisations devra probablement s’accompagner de nouvelles pratiques de supervision et de gouvernance technologique.
Vers des agents IA capables d’exécuter des tâches complexes ?
Avec GPT-5.4, OpenAI poursuit une trajectoire claire : transformer les modèles de langage en systèmes capables d’agir dans le monde numérique. L’association du raisonnement avancé, de la programmation et de l’interaction avec des interfaces informatiques rapproche progressivement l’IA de véritables agents autonomes capables de gérer des workflows complets.
Si ces technologies restent encore perfectibles, elles pourraient modifier profondément la manière dont certaines tâches professionnelles sont réalisées. Les outils d’IA ne se limiteraient plus à assister les utilisateurs, mais deviendraient des collaborateurs numériques capables de participer activement à la production et à l’exécution du travail.
Comment fonctionne GPT-5.4 ?
GPT-5.4 repose sur une architecture de modèle de langage multimodal orienté raisonnement, capable de combiner compréhension du langage naturel, génération de code et interaction avec des environnements logiciels. Le modèle s’appuie sur des réseaux neuronaux de type transformer à grande échelle, entraînés sur de vastes corpus de textes, de données techniques et de bases de code.
L’une des évolutions majeures introduites avec GPT-5.4 concerne l’intégration d’un système de raisonnement structuré et d’exécution d’actions numériques, permettant au modèle non seulement d’analyser une requête, mais aussi d’enchaîner plusieurs étapes logiques pour produire un résultat exploitable.
Le modèle peut également interagir avec un environnement informatique via un mécanisme de computer use, qui lui permet d’interpréter des captures d’écran, d’identifier des éléments d’interface et d’exécuter des actions (cliquer, écrire, naviguer entre applications). Cette capacité rapproche les modèles de langage de véritables agents logiciels capables d’opérer dans des workflows numériques complexes.
- Raisonnement avancé : résolution de problèmes complexes en plusieurs étapes logiques
- Génération et analyse de code : création, correction et optimisation de programmes dans plusieurs langages
- Computer use : interaction avec un environnement informatique à partir de captures d’écran
- Analyse de documents volumineux : exploitation d’une fenêtre de contexte pouvant atteindre un million de tokens
- Recherche d’outils dynamique (Tool Search) : chargement intelligent des outils nécessaires à une tâche donnée
- Consommation de calcul élevée : les modèles de raisonnement avancé nécessitent une puissance de calcul importante
- Fiabilité imparfaite : malgré les progrès, certaines réponses peuvent contenir des erreurs ou approximations
- Supervision nécessaire : les actions exécutées par l’IA dans un environnement informatique doivent être contrôlées
- Latence variable : les tâches complexes impliquant plusieurs étapes de raisonnement peuvent augmenter le temps de réponse
Pour aller plus loin
L’arrivée de modèles toujours plus performants pour le raisonnement et la programmation s’inscrit dans une compétition intense entre laboratoires d’IA pour repousser les capacités des systèmes dits frontier. Sur un sujet connexe, découvrez notre article « Claude Opus 4.6 et GPT-5.3 Codex dévoilés le même jour, la course aux modèles frontières s’accélère », qui met en perspective les stratégies technologiques des grands acteurs et les enjeux industriels liés au développement de ces modèles avancés.
Références
1. OpenAI. (2026). GPT-5.4 Technical Report.
https://openai.com/research/gpt-5-4
2. OpenAI. (2026). Benchmark results for GPT-5.4.
https://platform.openai.com/docs/models/gpt-5-4

