GPT-5.4 su VM0. Il cavallo di battaglia OpenAI

Il cavallo di battaglia della famiglia GPT-5 di OpenAI. Si colloca alla baseline di credito ×1 insieme a Claude Sonnet 4.6 ed è il predefinito giusto per la maggior parte degli agenti del framework Codex.

400K tokens · Text / Vision / Code · Prompt cache

Usa GPT-5.4 su VM0

GPT-5.4 è il cavallo di battaglia della famiglia GPT-5 di OpenAI — il modello che tieni in esecuzione ovunque per impostazione predefinita. Lo SWE-bench Verified dichiarato dal vendor al 74,9% lo colloca nello stesso intervallo di Claude Sonnet 4.6 sul coding, e la sua accuratezza nell'uso degli strumenti è ciò su cui sono ottimizzati la maggior parte degli agenti di produzione del framework Codex.

Il prezzo di listino vendor è di $2,5 / $15 per 1M di token con input in cache a $0,25 / 1M. Si colloca a ×1 crediti su VM0 Managed — la stessa baseline di Claude Sonnet 4.6 — il che lo rende la scelta naturale quando il tuo agente è già sul framework Codex e vuoi un predefinito equilibrato tra costo e qualità.

Cos'è GPT-5.4?

Aprile 2026 · Cavallo di battaglia della famiglia GPT-5. Il predefinito raccomandato per la maggior parte degli agenti del framework Codex.

GPT-5.4 è il cavallo di battaglia della generazione GPT-5 di OpenAI, rilasciato ad aprile 2026 insieme al modello di punta GPT-5.5 e all'ottimizzato sui costi GPT-5.4 Mini. OpenAI lo posiziona come predefinito ovunque per gli agenti sul framework Codex — il modello che tieni in esecuzione su ogni passaggio a meno che un passaggio specifico non giustifichi l'escalation a 5.5.

A livello architetturale GPT-5.4 condivide la finestra di contesto da 400K token, il parametro reasoning_effort, il prompt caching e la superficie Responses API con il resto della famiglia GPT-5. La distinzione rispetto a GPT-5.5 è l'investimento di calcolo per token: 5.4 gira più veloce e più economico, 5.5 investe di più nella profondità di ragionamento. La distinzione rispetto a GPT-5.4 Mini è opposta — 5.4 porta più qualità per i passaggi che decidono davvero l'esecuzione dell'agente.

Su VM0 si colloca al moltiplicatore di credito ×1, la stessa baseline di Claude Sonnet 4.6, il che rende banali i confronti di costo fianco a fianco tra i predefiniti di Anthropic e OpenAI. La scelta tra i due di solito si riduce al framework (Codex vs Claude Code), all'ecosistema (integrazioni esistenti, definizioni di strumenti) e a quale modello il tuo team ha più memoria muscolare comportamentale.

Cosa rende notevole GPT-5.4

Caratteristiche principali di architettura e capacità.

GPT-5.4 usa la stessa architettura del resto della famiglia GPT-5: finestra di contesto da 400K token, parametro reasoning_effort a quattro livelli (minimal, low, medium, high), prompt caching in cui l'input in cache è fatturato a un decimo della tariffa input e la superficie Responses API che la CLI codex usa per impostazione predefinita. Uso degli strumenti, structured output e computer use sono supportati. Gli input sono multimodali su testo, visione e codice.

Specifiche in breve

FamigliaGenerazione GPT-5

ModalitàTesto, visione, codice

LinguePrima l'inglese, multilingue

Prompt cachingSupportato (OpenAI)

Finestra di contesto400K token

Output massimoFino a 128K token

Reasoning effortMinimal / Low / Medium / High

Prezzo di listino vendor$2,5 input / $15 output per 1M

Benchmark di GPT-5.4

Punteggi dichiarati dal vendor tratti dai materiali di rilascio di GPT-5 di OpenAI, con i delta mostrati rispetto alla precedente generazione OpenAI. Le recensioni indipendenti collocano GPT-5.4 nella stessa fascia di qualità di coding di Claude Sonnet 4.6. Tratta le percentuali assolute come indicative.

SWE-bench Verifieddichiarato dal vendor

74,9%

Terminal-Bench 2.0uso degli strumenti dichiarato dal vendor

~58%

AIME 2025 (senza strumenti)matematica da competizione dichiarata dal vendor

~92%

GPQA Diamondscienza universitaria dichiarata dal vendor

~85%

OSWorld (computer use)dichiarato dal vendor

~62%

VelocitàArtificial Analysis, sforzo medio

~110 token/sec

Prezzi di GPT-5.4

Prezzo di listino del provider, per 1M di token.

Input$2.50

Output$15.00

Lettura cache$0.25

Scrittura cacheNon fatturato

Come si comporta GPT-5.4 nella pratica

Comportamento osservato dalle esecuzioni di agenti in produzione.

Routing degli strumenti

Solida accuratezza di base su tutto il catalogo di strumenti standard del framework Codex. Dove 5.5 prende il largo è sui casi limite difficili (selezione condizionale degli strumenti, argomenti profondamente annidati) — per i casi di routine 5.4 instrada correttamente con una latenza sensibilmente inferiore.

Modifiche al codice

Qualità delle patch paragonabile a Claude Sonnet 4.6 sui carichi standard di refactor e bug-fix. Dove 5.5 inizia a prendere il largo è sulle modifiche multi-file in cui la patch deve applicarsi in modo pulito al primo colpo.

Velocità

Nettamente più veloce di 5.5 — circa 110 token/sec a sforzo medio secondo Artificial Analysis. È in parte il motivo per cui 5.4 resta il predefinito per le risposte di chat interattive e i brevi loop agentici in cui la latenza visibile all'utente conta.

Efficienza dei costi

×1 crediti con comportamento di output nella fascia di qualità di Sonnet 4.6. Per i team già sul framework Codex, questo è il punto di equilibrio costo/qualità — fai escalation a 5.5 solo sui passaggi che ne hanno visibilmente bisogno.

Comportamento sulle allucinazioni

Eredita i miglioramenti di calibrazione che OpenAI ha introdotto con la generazione GPT-5. Meno incline a risposte sbagliate con sicurezza rispetto alla serie GPT-4, soprattutto su domande oltre il suo orizzonte di training.

I migliori task per agenti con GPT-5.4

Il passaggio predefinito dell'agente sul framework Codex

Se il tuo agente è già costruito sulla CLI codex o su qualsiasi integrazione del framework Codex, GPT-5.4 è il predefinito naturale ovunque. ×1 crediti, abbastanza veloce per l'uso interattivo, abbastanza accurato per le chiamate a strumenti di routine che dominano la maggior parte delle esecuzioni degli agenti.

La chat interattiva con visione

UI guidate da screenshot, Q&A su documenti, annotazione di immagini — GPT-5.4 gestisce tutti e tre in modo multimodale a velocità da cavallo di battaglia. Il moltiplicatore ×1 mantiene il costo per turno nella stessa fascia di Sonnet 4.6, così puoi metterli a confronto A/B sullo stesso carico di lavoro.

L'A/B costo/qualità contro Claude Sonnet 4.6

Entrambi i modelli si collocano a ×1 crediti su VM0 Managed, il che li rende direttamente comparabili sul costo. Esegui lo stesso agente su entrambi per una settimana e scegli in base al comportamento sul tuo carico di lavoro specifico — nessuno dei due è universalmente migliore, e il predefinito giusto dipende dal tuo catalogo di strumenti e dallo stile dei prompt.

Quando evitare GPT-5.4

Evita GPT-5.4 sui passaggi di ragionamento, computer use o modifica del codice multi-file più difficili in cui 5.5 è notevolmente in testa, e sul lavoro di classificazione o pre-filtraggio di massa ad alto volume in cui 5.4 Mini è quattro volte più economico a livello vendor.

GPT-5.4 vs altri modelli

GPT-5.4 vs GPT-5.5

Stessa famiglia, posizionamento diverso. 5.5 (×2) ti dà il ragionamento, il computer use e la qualità del codice al primo tentativo più forti; 5.4 (×1) ti dà la stessa finestra di contesto e lo stesso set di funzionalità a metà del costo in credito e a una velocità sensibilmente superiore. Usa 5.4 come predefinito; fai escalation a 5.5 solo sui passaggi che ne hanno visibilmente bisogno.

GPT-5.4 vs Claude Sonnet 4.6

Le due baseline ×1, una in ciascun ecosistema. Sonnet 4.6 gira sul framework Claude Code; GPT-5.4 gira su Codex. Scegli in base al framework su cui puntano i tuoi agenti e le tue definizioni di strumenti esistenti. Sulla qualità di output grezza sono abbastanza vicini da rendere l'A/B-test sul tuo carico di lavoro la scelta giusta.

GPT-5.4 vs GPT-5.4 Mini

Stessa famiglia, posizionamento diverso. 5.4 (×1) porta più qualità di ragionamento per token; 5.4 Mini (×0,3) ti dà un'opzione molto più economica per il lavoro di massa e di pre-filtraggio. Usa 5.4 Mini per la classificazione distribuita e 5.4 per i passaggi che decidono l'esecuzione dell'agente.

In sintesi: dovresti usare GPT-5.4?

GPT-5.4 è il predefinito ovunque per gli agenti del framework Codex su VM0. Fai escalation a 5.5 per il ragionamento difficile, scendi a 5.4 Mini per il pre-filtraggio di massa.

Domande frequenti

Qual è la finestra di contesto di GPT-5.4?

400.000 token, con fino a 128K token di output per risposta. L'intera finestra è fatturata a tariffe standard.

GPT-5.4 può gestire immagini?

Sì. GPT-5.4 è multimodale. Accetta input di immagini insieme a testo e codice in modo nativo.

Quando dovrei scegliere GPT-5.4 invece di Claude Sonnet 4.6?

Quando il tuo agente è già costruito sul framework Codex o ti serve l'ecosistema OpenAI (catalogo di strumenti, structured output, Responses API). Entrambi si collocano a ×1 crediti, quindi il costo è identico e la scelta si riduce al framework e all'idoneità comportamentale.

GPT-5.4 supporta il prompt caching?

Sì. L'input in cache è fatturato a $0,25 per 1M di token — uno sconto di 10× sulla porzione in cache.

Quale framework usa GPT-5.4 su VM0?

Codex. VM0 instrada tutti i modelli GPT-5 attraverso la superficie Responses API del framework Codex.

Alternative

GPT-5.5

Fascia di escalation per i passaggi più difficili

GPT-5.4 Mini

Opzione più economica per il lavoro di massa

Claude Sonnet 4.6

Omologo ×1 sul framework Claude Code

Usare GPT-5.4 su VM0

Due modi per accedere a GPT-5.4 su VM0

VM0 supporta GPT-5.4 come modello Built-in fatturato in crediti VM0 e tramite bring-your-own con una OpenAI API key. Il percorso Built-in usa il routing VM0 Managed e il moltiplicatore di crediti spiegato di seguito; il percorso bring-your-own ti fattura direttamente con il fornitore upstream e salta del tutto la conversione in crediti VM0.

La raccomandazione di VM0

VM0 posiziona GPT-5.4 come modello agente core, consigliato insieme a Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6 per i passi che determinano il risultato effettivo di un'esecuzione di un agente. Sono i modelli che sceglieremmo per il ruolo di orchestratore, per gli agenti che toccano il codice e per qualsiasi passo in cui una risposta sbagliata è costosa.

Crediti e il moltiplicatore ×1

Ogni modello Built-in su VM0 è prezzato come un multiplo di Claude Sonnet 4.6, che si colloca alla baseline di crediti ×1. GPT-5.4 viene fatturato a ×1 crediti. Il moltiplicatore è ciò che compare sulla tua fattura VM0; il prezzo di listino del fornitore nella tabella prezzi sopra è ciò che il provider upstream addebita prima che VM0 lo converta in crediti.

GPT-5.4 si colloca alla baseline ×1 rispetto alla quale è prezzato ogni altro modello Built-in, quindi è l'unità con cui confronti i costi quando scegli tra i modelli su VM0.

Disponibile su VM0 dal April 2026.