Tous les modèles

GPT-5.4 Mini sur VM0. Le GPT-5 économique

Le membre optimisé en coût de la famille GPT-5 d'OpenAI. ×0,3 crédits, vision multimodale, et assez rapide pour le routage à fort volume, la classification et le pré-filtrage.

400K tokens · Text / Vision / Code · Prompt cache

GPT-5.4 Mini est le membre économique de la famille GPT-5 d'OpenAI — celui que l'on choisit quand le coût unitaire compte plus que la qualité de raisonnement de pointe. Il conserve la fenêtre de contexte de 400K et les entrées multimodales du reste de la famille, mais réduit le calcul par token, ce qui se traduit par un prix plus bas (0,75 $ / 4,5 $ par million) et une vitesse nettement plus élevée.

Sur VM0, il se situe à ×0,3 crédits, le même multiplicateur que Kimi K2.7 Code, ce qui en fait le choix naturel côté OpenAI pour la classification en masse, le routage en éventail, les pré-filtres, et toute étape d'agent où passer à un tiers du coût de GPT-5.4 est le facteur décisif.

Qu'est-ce que GPT-5.4 Mini ?

Avril 2026 · Variante économique de la famille GPT-5. L'équivalent côté OpenAI de Kimi K2.7 Code.

GPT-5.4 Mini est le membre optimisé en coût de la génération GPT-5 d'OpenAI, sorti en avril 2026 aux côtés de GPT-5.5 et GPT-5.4. OpenAI le positionne comme le palier à fort débit — le modèle que l'on garde en marche sur les étapes de classification, de routage et de pré-filtrage où la 5.4 ou la 5.5, plus grandes, seraient gaspillées sur des décisions de routine.

Architecturalement, il partage la fenêtre de contexte de 400K tokens de la famille GPT-5, le paramètre reasoning_effort, la mise en cache des prompts, et la surface de l'API Responses que le CLI codex utilise par défaut. Le compromis face à la 5.4 est la profondeur de raisonnement : Mini gère bien les appels d'outils standard, les courts résumés et les charges de sortie structurée, mais commence à dériver sur les plans multi-étapes plus difficiles où la 5.4 tient encore. Le compromis face aux concurrents au même prix est l'écosystème — si vous êtes déjà sur Codex, rester dans la surface OpenAI maintient la cohérence des définitions d'outils et des schémas de sortie structurée.

Sur VM0, Mini se situe au multiplicateur de crédits ×0,3, le même que Kimi K2.7 Code. DeepSeek V4 Pro est plus bas à ×0,1, donc au sein du palier économique, le choix dépend surtout du framework et de l'adéquation comportementale sur votre charge de travail précise.

Ce qui distingue GPT-5.4 Mini

Principales caractéristiques d'architecture et de capacités.

GPT-5.4 Mini utilise la même architecture que le reste de la famille GPT-5 : fenêtre de contexte de 400K tokens, le paramètre reasoning_effort à quatre niveaux, la mise en cache des prompts où l'entrée mise en cache est facturée au dixième du tarif d'entrée, et la surface de l'API Responses. L'usage d'outils, les sorties structurées et les entrées de vision multimodale sont pris en charge. Le modèle est un frère plus petit et plus rapide — moins de paramètres par token, plus de débit par dollar.

Spécifications en un coup d'œil

FamilleGénération GPT-5
ModalitésTexte, vision, code
LanguesAnglais en priorité, multilingue
Mise en cache des promptsPrise en charge (OpenAI)
Fenêtre de contexte400K tokens
Sortie maximaleJusqu'à 128K tokens
Effort de raisonnementMinimal / Low / Medium / High
Prix de liste fournisseur0,75 $ en entrée / 4,5 $ en sortie par million

Benchmarks de GPT-5.4 Mini

Scores rapportés par le fournisseur, issus des supports de lancement de GPT-5 Mini d'OpenAI. Les tests indépendants placent la 5.4 Mini dans la même bande économique que Kimi K2.7 Code sur la plupart des benchmarks d'agents. Considérez les pourcentages absolus comme indicatifs.

SWE-bench Verifiedrapporté par le fournisseur
~60 %
Terminal-Bench 2.0usage d'outils rapporté par le fournisseur
~42 %
AIME 2025 (sans outils)mathématiques de compétition rapportées par le fournisseur
~84 %
GPQA Diamondscience de niveau doctorat rapportée par le fournisseur
~74 %
VitesseArtificial Analysis, effort medium
~165 tokens/s

Tarification de GPT-5.4 Mini

Prix catalogue fournisseur, par million de tokens.

Entrée$0.75
Sortie$4.50
Lecture cache$0.07
Écriture cacheNon facturé

Comment GPT-5.4 Mini se comporte en pratique

Comportement observé lors d'exécutions d'agents en production.

Vitesse

Le modèle le plus rapide de la famille GPT-5 — environ 165 tokens/s à effort medium selon Artificial Analysis. C'est la propriété qui le rend viable pour les réponses de chat interactives et les courts appels d'outils en éventail où la latence visible par l'utilisateur domine.

Appels d'outils de routine

Précis sur le catalogue d'outils standard du framework Codex. Là où la 5.4 prend l'avantage, c'est sur les cas limites difficiles (sélection conditionnelle d'outils, arguments profondément imbriqués) — pour les cas de routine, Mini gère proprement le routage d'outils à un tiers du coût.

Classification en masse et pré-filtrage

La meilleure position coût/qualité de la famille GPT-5 pour le travail en éventail. Triage de PR en masse, catégorisation de tickets de support, classification de documents par palier — toutes les charges où vous auriez auparavant codé des regex à la main deviennent abordables dans un vrai appel de modèle.

Efficacité en coût

×0,3 crédits avec la vision multimodale incluse. Mini et Kimi K2.7 Code se situent dans la même bande, tandis que DeepSeek V4 Pro est plus bas à ×0,1 — le choix se résume généralement à l'adéquation du framework et au comportement sur votre charge de travail précise.

Quand escalader

Mini dérive sur les longs plans multi-étapes, le raisonnement difficile et les éditions de code multi-fichiers dès la première tentative. Concevez l'agent de sorte que l'orchestrateur décide quand escalader vers la 5.4 ou la 5.5, et non de sorte que Mini essaie de porter toute la boucle.

Meilleures tâches d'agent pour GPT-5.4 Mini

Le classificateur en éventail qui tourne sur chaque événement

Ticket de support entrant, commentaire de PR, transcription d'appel commercial, dépôt de document — Mini lit chacun et le route vers le bon agent en aval ou le bon relecteur humain. ×0,3 crédits et 165 tokens/s signifient que le coût par événement est assez faible pour qu'exécuter sur chaque événement (et non sur des lots échantillonnés) soit réellement viable.

L'étape de pré-filtrage avant le modèle coûteux

Placez Mini en tête de l'appel d'outil de l'agent pour qu'il décide si la requête a même besoin d'escalader. La plupart des requêtes obtiennent une réponse rapide et bon marché ; seule la minorité résiduelle paie le coût plein de GPT-5.4 ou 5.5. C'est là qu'empiler les paliers économique et cœur change réellement ce qui est abordable.

La réponse de chat interactive

De courts tours multimodaux où la latence visible par l'utilisateur domine l'expérience. Mini répond assez vite pour que le streaming paraisse instantané, et la prise en charge multimodale fait qu'une capture d'écran dans la conversation fonctionne tout simplement.

Quand éviter GPT-5.4 Mini

Évitez GPT-5.4 Mini sur le raisonnement le plus difficile, l'orchestration d'agents multi-étapes, les séquences d'usage de l'ordinateur et les éditions de code multi-fichiers dès la première tentative — escaladez vers la 5.4 pour les versions de routine de ces tâches et vers la 5.5 pour les plus difficiles.

GPT-5.4 Mini vs autres modèles

GPT-5.4 Mini vs GPT-5.4

Même famille, positionnement différent. La 5.4 Mini (×0,3) l'emporte sur le coût et la vitesse ; la 5.4 (×1) l'emporte sur la qualité de raisonnement et la précision du routage d'outils sur les cas difficiles. Le schéma standard consiste à pré-filtrer avec Mini et à escalader les cas résiduels vers la 5.4.

GPT-5.4 Mini vs Claude Sonnet 4.6

Claude Sonnet 4.6 est la cible de comparaison actuelle du catalogue pour ce modèle.

GPT-5.4 Mini vs DeepSeek V4 Pro

DeepSeek V4 Pro se situe plus bas sur les crédits VM0 et constitue le choix de raisonnement axé coût le plus solide. Utilisez-le quand le prix domine, et utilisez le modèle courant quand son adéquation fournisseur ou son profil de routage d'outils compte davantage.

En résumé : devriez-vous utiliser GPT-5.4 Mini ?

GPT-5.4 Mini est la valeur par défaut économique côté OpenAI. Pré-filtrez avec Mini, escaladez vers GPT-5.4 pour les étapes de routine, escaladez vers GPT-5.5 uniquement pour le raisonnement le plus difficile.

Questions fréquentes

Quelle est la fenêtre de contexte de GPT-5.4 Mini ?

400 000 tokens, avec jusqu'à 128K tokens de sortie par réponse — la même que le reste de la famille GPT-5.

GPT-5.4 Mini peut-il traiter des images ?

Oui. Comme le reste de la famille GPT-5, il accepte les entrées image aux côtés du texte et du code.

Quand dois-je choisir GPT-5.4 Mini plutôt que Kimi K2.7 Code ?

Quand votre agent est déjà construit sur le framework Codex ou que vous avez besoin de l'écosystème OpenAI de sortie structurée / appels d'outils. Les deux se situent à ×0,3 crédits, donc le coût est identique et le choix se résume au framework et au comportement.

GPT-5.4 Mini prend-il en charge la mise en cache des prompts ?

Oui. L'entrée mise en cache est facturée à 0,075 $ par million de tokens — une remise de 10× sur la portion mise en cache.

Quel framework GPT-5.4 Mini utilise-t-il sur VM0 ?

Codex. VM0 route tous les modèles GPT-5 via la surface de l'API Responses du framework Codex.

Alternatives

Utiliser GPT-5.4 Mini sur VM0

Deux façons d'accéder à GPT-5.4 Mini sur VM0

VM0 prend en charge GPT-5.4 Mini comme modèle Built-in facturé en crédits VM0, et via le bring-your-own avec une OpenAI API key. La voie Built-in utilise le routage VM0 Managed et le multiplicateur de crédits expliqué ci-dessous ; la voie bring-your-own vous facture directement auprès du fournisseur en amont et contourne entièrement la conversion en crédits VM0.

La recommandation de VM0

VM0 positionne GPT-5.4 Mini comme une option économique plutôt qu'un modèle d'agent central. Utilisez-le pour optimiser le coût unitaire sur le travail non central, comme la classification en masse, les pré-filtres, les réponses courtes critiques en latence, ou les agents legacy figés, tout en gardant Claude Opus 4.7, Claude Opus 4.6 ou Claude Sonnet 4.6 sur les étapes qui décident de l'exécution.

Les crédits et le multiplicateur ×0.3

Chaque modèle Built-in sur VM0 est tarifé comme un multiple de Claude Sonnet 4.6, qui se situe à la référence de crédits ×1. GPT-5.4 Mini est facturé à ×0.3 crédits. Le multiplicateur est ce qui apparaît sur votre facture VM0 ; le prix catalogue du fournisseur dans le tableau de tarification ci-dessus est ce que le fournisseur en amont facture avant que VM0 ne le convertisse en crédits.

GPT-5.4 Mini est facturé à ×0.3, ce qui signifie qu'une étape ici ne coûte que 0.3× les crédits d'une étape équivalente sur Sonnet 4.6 (la référence ×1). Cela le place bien en dessous de la référence de crédits et en fait le choix naturel pour du travail de fond à fort volume où le coût par étape compte plus que la qualité de raisonnement maximale.

Disponible sur VM0 depuis le April 2026.