GPT-5.4 sur VM0. Le cheval de trait d'OpenAI
Le cheval de trait de la famille GPT-5 d'OpenAI. Se situe à la référence de ×1 crédit aux côtés de Claude Sonnet 4.6 et constitue le bon choix par défaut pour la plupart des agents du framework Codex.
400K tokens · Text / Vision / Code · Prompt cache
GPT-5.4 est le cheval de trait de la famille GPT-5 d'OpenAI — le modèle que vous gardez en service partout par défaut. Un SWE-bench Verified de 74,9 % communiqué par le fournisseur le place dans la même fourchette que Claude Sonnet 4.6 sur le codage, et sa précision d'utilisation d'outils est la référence sur laquelle sont réglés la plupart des agents du framework Codex en production.
Le prix catalogue du fournisseur est de 2,5 $ / 15 $ par 1M de tokens, avec l'entrée mise en cache à 0,25 $ / 1M. Il se situe à ×1 crédit sur VM0 Managed — la même référence que Claude Sonnet 4.6 — ce qui en fait le choix naturel quand votre agent est déjà sur le framework Codex et que vous voulez un compromis coût/qualité équilibré par défaut.
Qu'est-ce que GPT-5.4 ?
Avril 2026 · Cheval de trait de la famille GPT-5. Le choix par défaut recommandé pour la plupart des agents du framework Codex.
GPT-5.4 est le cheval de trait de la génération GPT-5 d'OpenAI, sorti en avril 2026 aux côtés du modèle phare GPT-5.5 et du GPT-5.4 Mini optimisé en coût. OpenAI le positionne comme la valeur par défaut généralisée pour les agents sur le framework Codex — le modèle que vous gardez en service à chaque étape, sauf si une étape précise justifie une escalade vers la 5.5.
Sur le plan de l'architecture, GPT-5.4 partage avec le reste de la famille GPT-5 la fenêtre de contexte de 400K tokens, le paramètre reasoning_effort, la mise en cache des prompts et la surface Responses API. La distinction avec le GPT-5.5 est l'investissement en calcul par token : la 5.4 tourne plus vite et moins cher, la 5.5 investit davantage dans la profondeur de raisonnement. La distinction avec le GPT-5.4 Mini est l'inverse — la 5.4 apporte plus de qualité pour les étapes qui décident réellement de l'exécution de l'agent.
Sur VM0, il se situe au multiplicateur de ×1 crédit, la même référence que Claude Sonnet 4.6, ce qui rend triviales les comparaisons de coût côte à côte entre les valeurs par défaut d'Anthropic et d'OpenAI. Le choix entre les deux se résume généralement au framework (Codex contre Claude Code), à l'écosystème (intégrations existantes, définitions d'outils) et au modèle que votre équipe maîtrise le mieux par habitude.
Ce qui distingue GPT-5.4
Principales caractéristiques d'architecture et de capacités.
GPT-5.4 utilise la même architecture que le reste de la famille GPT-5 : fenêtre de contexte de 400K tokens, paramètre reasoning_effort à quatre niveaux (minimal, low, medium, high), mise en cache des prompts (l'entrée mise en cache étant facturée au dixième du tarif d'entrée), et la surface Responses API qu'utilise codex CLI par défaut. L'utilisation d'outils, les sorties structurées et le computer-use sont pris en charge. Les entrées sont multimodales : texte, vision et code.
Spécifications en un coup d'œil
Benchmarks de GPT-5.4
Scores communiqués par le fournisseur, issus des documents de lancement du GPT-5 d'OpenAI, avec les écarts indiqués par rapport à la précédente génération OpenAI. Les tests indépendants placent GPT-5.4 dans la même tranche de qualité de codage que Claude Sonnet 4.6. Considérez les pourcentages absolus comme indicatifs.
Tarification de GPT-5.4
Prix catalogue fournisseur, par million de tokens.
Comment GPT-5.4 se comporte en pratique
Comportement observé lors d'exécutions d'agents en production.
Routage des outils
Précision de référence solide sur le catalogue d'outils standard du framework Codex. Là où la 5.5 prend l'avantage, c'est sur les cas limites difficiles (sélection conditionnelle d'outils, arguments profondément imbriqués) — pour les cas de routine, la 5.4 route correctement avec une latence nettement plus faible.
Modifications de code
Qualité de correctifs comparable à Claude Sonnet 4.6 sur les charges de refactorisation et de correction de bugs standard. Là où la 5.5 commence à prendre l'avantage, c'est sur les changements multi-fichiers où le correctif doit s'appliquer proprement du premier coup.
Vitesse
Sensiblement plus rapide que la 5.5 — environ 110 tokens/s à l'effort medium selon Artificial Analysis. C'est en partie pour cela que la 5.4 reste le choix par défaut pour les réponses de chat interactives et les courtes boucles d'agents, où la latence visible par l'utilisateur compte.
Efficacité des coûts
×1 crédit avec un comportement de sortie dans la tranche de qualité du Sonnet 4.6. Pour les équipes déjà sur le framework Codex, c'est le point d'équilibre coût/qualité — ne passez à la 5.5 que sur les étapes qui en ont visiblement besoin.
Comportement face aux hallucinations
Hérite des améliorations de calibration livrées par OpenAI avec la génération GPT-5. Moins enclin aux réponses fausses et péremptoires que la série GPT-4, surtout sur les questions hors de son horizon d'entraînement.
Meilleures tâches d'agent pour GPT-5.4
L'étape d'agent par défaut sur le framework Codex
Si votre agent est déjà bâti sur codex CLI ou sur une intégration quelconque du framework Codex, GPT-5.4 est la valeur par défaut généralisée naturelle. ×1 crédit, assez rapide pour un usage interactif, assez précis pour les appels d'outils de routine qui dominent la plupart des exécutions d'agents.
Le chat interactif avec vision
Interfaces pilotées par captures d'écran, questions-réponses sur documents, annotation d'images — GPT-5.4 gère les trois en multimodal à vitesse de cheval de trait. Le multiplicateur de ×1 maintient le coût par tour dans la même tranche que le Sonnet 4.6, de sorte que vous pouvez faire un A/B des deux sur la même charge de travail.
L'A/B coût/qualité face à Claude Sonnet 4.6
Les deux modèles se situent à ×1 crédit sur VM0 Managed, ce qui les rend directement comparables en coût. Faites tourner le même agent sur les deux pendant une semaine et choisissez selon le comportement sur votre charge de travail précise — aucun n'est universellement meilleur, et le bon choix par défaut dépend de votre catalogue d'outils et de votre style de prompt.
Quand éviter GPT-5.4
Évitez GPT-5.4 sur les étapes de raisonnement, de computer-use ou de modification de code multi-fichiers les plus difficiles, où la 5.5 mène nettement, et sur le travail de classification ou de pré-filtrage en masse à fort volume, où la 5.4 Mini est quatre fois moins chère au niveau fournisseur.
GPT-5.4 vs autres modèles
GPT-5.4 vs GPT-5.5
Même famille, positionnement différent. La 5.5 (×2) vous offre le raisonnement, le computer-use et la qualité de code au premier essai les plus solides ; la 5.4 (×1) vous offre la même fenêtre de contexte et le même jeu de fonctionnalités pour moitié moins de crédits et une vitesse nettement supérieure. Par défaut, utilisez la 5.4 ; n'escaladez vers la 5.5 que sur les étapes qui en ont visiblement besoin.
GPT-5.4 vs Claude Sonnet 4.6
Les deux références à ×1, une dans chaque écosystème. Le Sonnet 4.6 tourne sur le framework Claude Code ; GPT-5.4 tourne sur Codex. Choisissez selon le framework que visent vos agents et définitions d'outils existants. Sur la qualité de sortie brute, ils sont assez proches pour qu'un A/B sur votre charge de travail soit la bonne approche.
GPT-5.4 vs GPT-5.4 Mini
Même famille, positionnement différent. La 5.4 (×1) apporte plus de qualité de raisonnement par token ; la 5.4 Mini (×0,3) vous offre une option bien moins chère pour le travail en masse et de pré-filtrage. Utilisez la 5.4 Mini pour la classification en éventail et la 5.4 pour les étapes qui décident de l'exécution de l'agent.
En résumé : devriez-vous utiliser GPT-5.4 ?
GPT-5.4 est la valeur par défaut généralisée pour les agents du framework Codex sur VM0. Escaladez vers la 5.5 pour le raisonnement difficile, descendez vers la 5.4 Mini pour le pré-filtrage en masse.
Questions fréquentes
Quelle est la fenêtre de contexte du GPT-5.4 ?
400 000 tokens, avec jusqu'à 128K tokens de sortie par réponse. Toute la fenêtre est facturée au tarif standard.
GPT-5.4 peut-il traiter des images ?
Oui. GPT-5.4 est multimodal. Il accepte nativement des entrées image en plus du texte et du code.
Quand dois-je choisir GPT-5.4 plutôt que Claude Sonnet 4.6 ?
Lorsque votre agent est déjà bâti sur le framework Codex ou que vous avez besoin de l'écosystème OpenAI (catalogue d'outils, sorties structurées, Responses API). Les deux se situent à ×1 crédit, donc le coût est identique et le choix se résume au framework et à l'adéquation comportementale.
GPT-5.4 prend-il en charge la mise en cache des prompts ?
Oui. L'entrée mise en cache est facturée 0,25 $ par 1M de tokens — une remise de 10× sur la portion mise en cache.
Quel framework GPT-5.4 utilise-t-il sur VM0 ?
Codex. VM0 route tous les modèles GPT-5 via la surface Responses API du framework Codex.
Alternatives
Utiliser GPT-5.4 sur VM0
Deux façons d'accéder à GPT-5.4 sur VM0
VM0 prend en charge GPT-5.4 comme modèle Built-in facturé en crédits VM0, et via le bring-your-own avec une OpenAI API key. La voie Built-in utilise le routage VM0 Managed et le multiplicateur de crédits expliqué ci-dessous ; la voie bring-your-own vous facture directement auprès du fournisseur en amont et contourne entièrement la conversion en crédits VM0.
La recommandation de VM0
VM0 positionne GPT-5.4 comme un modèle d'agent central, recommandé aux côtés de Claude Opus 4.7, Claude Opus 4.6 et Claude Sonnet 4.6 pour les étapes qui déterminent le résultat réel d'une exécution d'agent. Ce sont les modèles que nous choisirions pour le rôle d'orchestrateur, pour les agents touchant au code, et pour toute étape où une mauvaise réponse coûte cher.
Les crédits et le multiplicateur ×1
Chaque modèle Built-in sur VM0 est tarifé comme un multiple de Claude Sonnet 4.6, qui se situe à la référence de crédits ×1. GPT-5.4 est facturé à ×1 crédits. Le multiplicateur est ce qui apparaît sur votre facture VM0 ; le prix catalogue du fournisseur dans le tableau de tarification ci-dessus est ce que le fournisseur en amont facture avant que VM0 ne le convertisse en crédits.
GPT-5.4 se situe à la référence ×1 par rapport à laquelle tous les autres modèles Built-in sont tarifés, c'est donc l'unité avec laquelle vous comparez les coûts au moment de choisir entre les modèles sur VM0.
Disponible sur VM0 depuis le April 2026.