Claude Opus 4.7

Il modello di punta Claude 4 di Anthropic. La scelta più forte della famiglia per loop agentici a lungo orizzonte, ragionamento difficile e modifiche al codice al primo tentativo.

1M tokens · Text / Vision / Code · Prompt cache

Usa Claude Opus 4.7 su VM0

Claude Opus 4.7 è il modello a cui rivolgersi quando il lavoro deve essere corretto al primo colpo: codice che compila in modo pulito, piani multi-passaggio che non perdono il filo lungo lunghe catene di strumenti, rompicapo astratti su cui i modelli più piccoli inciampano. I benchmark vendor (SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2, OSWorld, BrowseComp) danno numeri concreti ai progressi rispetto a Opus 4.6.

Il prezzo di listino vendor è di $5 / $25 per 1M di token con input in cache a $0,50 / 1M, il più alto della famiglia Claude. Lo schema conveniente è tenere Sonnet 4.6 come predefinito e instradare a Opus solo i passaggi più difficili.

Cos'è Claude Opus 4.7?

Aprile 2026 (successore di Opus 4.6) · Vertice della famiglia Claude 4. L'aggiornamento raccomandato da Anthropic per gli utenti di Opus 4.6.

Claude Opus 4.7 è il modello di punta della famiglia Claude 4 di Anthropic, rilasciato ad aprile 2026 come aggiornamento raccomandato da Opus 4.6. Anthropic lo presenta come un cambio di passo nel coding agentico e nel ragionamento astratto più che come un refresh dell'API superficiale. La finestra di contesto da 1M di token e i livelli di sforzo del ragionamento adattivo introdotti in 4.6 vengono mantenuti invariati, quindi il codice degli agenti esistenti si integra senza riscritture.

Rispetto a Sonnet 4.6 (il cavallo di battaglia della stessa famiglia), Opus investe più calcolo per token. Il vantaggio comportamentale si vede in tre punti: meno istruzioni perse nei lunghi loop agentici, patch al codice al primo tentativo nettamente migliori e un richiamo più forte quando la cronologia della conversazione supera i 100K token. Il compromesso è il prezzo di listino più alto della famiglia Claude ($5 / $25 per 1M di token) e una velocità di output per token inferiore, motivo per cui Anthropic stessa posiziona Opus come fascia di orchestrazione o di escalation più che come predefinito ovunque.

Le classifiche indipendenti (Artificial Analysis, Vellum) confermano l'ordinamento relativo rispetto a Opus 4.6, ma i numeri assoluti cambiano ogni settimana e OpenAI ha segnalato contaminazione dei dati di training su SWE-bench Verified per tutti i modelli di frontiera. Tratta i punteggi pubblici come indicativi più che autorevoli; le differenze comportamentali strutturate (coerenza sui loop lunghi, qualità delle patch al primo tentativo, affidabilità del routing multi-strumento) sono il segnale più duraturo.

Cosa rende notevole Claude Opus 4.7

Caratteristiche principali di architettura e capacità.

Opus 4.7 mantiene la finestra di contesto da 1M di token di Opus 4.6, fatturata al prezzo input standard su tutta la finestra. Supporta il ragionamento adattivo a quattro livelli di sforzo (low, medium, high e max), una Compaction API per la sintesi del contesto lato server sulle esecuzioni lunghe e il prompt caching in cui l'input in cache è fatturato a un decimo della tariffa input. Le superfici multi-agente e di uso degli strumenti sono invariate rispetto a 4.6, incluso il Mailbox Protocol per i team di agenti peer-to-peer e il parametro inference_geo che espone l'inferenza solo USA a un moltiplicatore di 1,1×. Gli input sono multimodali su testo, visione e codice.

Specifiche in breve

FamigliaGenerazione Claude 4

ModalitàTesto, visione, codice

LinguePrima l'inglese, multilingue

Prompt cachingSupportato (Anthropic)

Finestra di contesto1M di token

Output massimoFino a 64K token

Livelli di sforzoLow / Medium / High / Max

Prezzo di listino vendor$5 input / $25 output per 1M

Benchmark di Claude Opus 4.7

Punteggi dichiarati dal vendor tratti dai materiali di rilascio di Opus 4.7 di Anthropic, con i delta mostrati rispetto ai numeri pubblici di Opus 4.6. Le recensioni indipendenti collocano 4.7 davanti a GPT-5.2 sulla maggior parte dei task di coding agentico ed entro pochi punti da Gemini 3 Pro sul ragionamento astratto. Tratta le percentuali assolute come indicative; OpenAI ha segnalato contaminazione dei dati di training su SWE-bench Verified per tutti i modelli di frontiera.

SWE-bench Verifieddichiarato dal vendor; in crescita dal 80,8% di Opus 4.6

~83,5%

SWE-bench Prodichiarato dal vendor

In testa alla famiglia Claude al lancio

Terminal-Bench 2.0dichiarato dal vendor; in crescita dal 65,4% di Opus 4.6

~71%

τ2-bench Retailuso degli strumenti dichiarato dal vendor

~93%

OSWorld (computer use)dichiarato dal vendor; in crescita dal 72,7% di Opus 4.6

~76%

BrowseComptask web dichiarati dal vendor

~88%

ARC AGI 2dichiarato dal vendor; in crescita dal 68,8% di Opus 4.6

~75%

Humanity's Last Exam (con strumenti)dichiarato dal vendor

In testa alla famiglia Claude

GPQA Diamondscienza di livello universitario dichiarata dal vendor

~92%

MRCR v2 (1M, 8-needle)richiamo long-context

Migliorato rispetto al 76% di 4.6

MMMU Pro (multimodale)dichiarato dal vendor

In testa alla famiglia Claude

Prezzi di Claude Opus 4.7

Prezzo di listino del provider, per 1M di token.

Input$5.00

Output$25.00

Lettura cache$0.50

Scrittura cache$6.25

Come si comporta Claude Opus 4.7 nella pratica

Comportamento osservato dalle esecuzioni di agenti in produzione.

Routing degli strumenti

Il tasso più basso di chiamate a strumenti mal instradate nella famiglia Claude. Il divario rispetto a Sonnet 4.6 si allarga sui casi limite difficili come la selezione condizionale degli strumenti, gli argomenti profondamente annidati e le chiamate a strumenti emesse dopo lunghi tratti di ragionamento.

Richiamo long-context

Coerente su trascrizioni di agenti oltre i 200K token. La finestra da 1M di token regge molto meglio dei predecessori grazie ai miglioramenti sul context-rot introdotti da Anthropic in Opus 4.6 e ulteriormente affinati per 4.7. L'MRCR v2 dichiarato dal vendor a 1M mostra un incremento misurabile rispetto al 76% di Opus 4.6.

Modifiche al codice al primo tentativo

La migliore qualità delle patch nella famiglia Claude. La scelta giusta quando un agente deve modificare codice che deve continuare a compilare e a superare i test, soprattutto quando la patch tocca più file. Il risultato di Anthropic su Terminal-Bench 2.0 lo riflette direttamente.

Velocità

Più lento di Sonnet 4.6 e notevolmente più lento di Kimi K2.7 Code. Anthropic pubblica circa 41 token/sec a sforzo massimo per Opus 4.6, e 4.7 è in un intervallo simile. Riservalo ai passaggi che hanno davvero bisogno della profondità di ragionamento extra ed esegui in parallelo le fasce più leggere.

Comportamento sulle allucinazioni

Opus 4.7 mantiene la postura prudente di rifiuto di Anthropic e tende ad ammettere l'incertezza più che a confabulare, motivo per cui i team in produzione continuano a pagare il premio per il ragionamento ad alto rischio nonostante alternative open-weight più economiche come Kimi K2.7 Code e DeepSeek V4 Pro lo eguaglino ormai nei benchmark.

I migliori task per agenti con Claude Opus 4.7

La revisione di PR che coglie ciò che gli umani non vedono

Quando una pull request modifica 30 file, Opus 4.7 tiene l'intera modifica nella memoria di lavoro e scrive una revisione che collega ciò che è cambiato in auth/middleware.ts al test che ha rotto in routes/admin.test.ts. I revisori junior ricevono il tipo di feedback tra file che gli ingegneri senior di solito colgono a una seconda passata, e il team rilascia meno patch che passano la CI ma si rompono in produzione.

L'analisi che legge l'intera pila

Inserisci nella finestra di contesto da 1M di token una bozza di contratto di 200 pagine, tre proposte di concorrenti e i pareri legali dell'ultimo trimestre, poi chiedi a Opus di segnalare ogni clausola più stringente del mercato ed elencare i probabili punti di negoziazione. I modelli più piccoli iniziano a perdere le sezioni precedenti dopo 100K token; Opus mantiene l'intero quadro sotto controllo e cita il paragrafo esatto da cui sta estraendo.

L'orchestratore che esegue un piano multi-strumento

Usa Opus 4.7 come pianificatore che scompone la richiesta di un cliente in dieci passaggi, ne affida ciascuno a un sub-agent basato su Sonnet o a un sub-agent a basso costo e ricuce i risultati. Eseguire Opus solo al livello del pianificatore (e le fasce più economiche ovunque) costa una frazione rispetto a eseguire Opus dall'inizio alla fine, preservando gran parte della qualità.

Le modifiche al codice al primo tentativo che non sprecano un'esecuzione di CI

Chiedi a Opus 4.7 di migrare una codebase di 50 file da un ORM a un altro, di rifattorizzare un modulo ingarbugliato o di applicare un fix di sicurezza su tutto il repo. La patch si applica in modo pulito al primo tentativo più spesso di qualsiasi altro modello della famiglia, cosa che il Terminal-Bench 2.0 dichiarato dal vendor riflette, e che si rifletterà anche sulla tua bolletta CI.

Quando evitare Claude Opus 4.7

Evita Opus 4.7 sul lavoro di routine ad alto volume in cui Sonnet 4.6 raggiunge lo stesso livello di qualità a una frazione del costo, sulle risposte di chat sensibili alla latenza in cui Kimi K2.7 Code è molto più veloce e sui lavori di classificazione o estrazione di massa in cui GPT-5.4 Mini è l'opzione di massa supportata più economica.

Claude Opus 4.7 vs altri modelli

Claude Opus 4.7 vs Claude Opus 4.8

Opus 4.8 è il nuovo modello di punta allo stesso moltiplicatore VM0. Usa 4.8 per i nuovi agenti ad alto rischio; mantieni 4.7 solo quando un workflow esistente è stato validato su di esso e la stabilità conta più dei più recenti progressi nei benchmark.

Claude Opus 4.7 vs Claude Sonnet 4.6

Sonnet 4.6 è il cavallo di battaglia predefinito della famiglia Claude e la scelta giusta per la maggior parte degli agenti. Passa a Opus 4.7 solo quando Sonnet fallisce visibilmente su ragionamento difficile, contesto lungo o modifiche al codice al primo tentativo, di solito come orchestratore che delega verso il basso a sub-agent basati su Sonnet o a sub-agent a basso costo.

Claude Opus 4.7 vs Claude Opus 4.6

Stessa finestra di contesto (1M di token), stessi prezzi vendor e stessa architettura di ragionamento adattivo. Opus 4.7 è la generazione più recente con progressi dichiarati dal vendor su SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2 e OSWorld. Scegli 4.7 per i nuovi agenti; mantieni 4.6 solo quando un agente esistente è stato validato su quella versione e ti serve stabilità di comportamento.

Claude Opus 4.7 vs Kimi K2.7 Code

Il Kimi K2.7 Code di Moonshot è in testa a diversi benchmark agentici alla frontiera open-source (SWE-bench Pro dichiarato dal vendor 58,6 contro il 53,4 di Opus 4.6). Opus 4.7 mantiene il primato sull'affidabilità del routing degli strumenti per gli agenti di produzione in lingua inglese e sul profilo di sicurezza, motivo per cui la maggior parte dei team enterprise lo tiene ancora come fascia ad alto rischio.

Claude Opus 4.7 vs DeepSeek V4 Pro

DeepSeek V4 Pro è indietro rispetto a Opus sulla maggior parte dei benchmark di ragionamento ma lo eguaglia sul coding (SWE-bench Verified dichiarato dal vendor entro ~0,2 punti). La distinzione è semplice: scegli DeepSeek quando domina il costo grezzo, scegli Opus 4.7 quando affidabilità, profilo di sicurezza o accuratezza del routing degli strumenti contano più del prezzo per chiamata.

In sintesi: dovresti usare Claude Opus 4.7?

Opus 4.7 è la fascia di escalation. Usa Sonnet 4.6 come predefinito; passa a Opus solo sui passaggi specifici in cui Sonnet fallisce visibilmente.

Domande frequenti

Qual è la finestra di contesto di Claude Opus 4.7?

1 milione di token, con fino a 64K token di output per risposta. L'intera finestra è fatturata a tariffe standard. Una richiesta da 900K token ha la stessa tariffa per token di una richiesta da 9K token.

Claude Opus 4.7 può gestire immagini?

Sì. Opus 4.7 è multimodale. Accetta input di immagini insieme a testo e codice, quindi gli agenti guidati da screenshot e da visione documentale funzionano in modo nativo.

Quando dovrei scegliere Opus 4.7 invece di Sonnet 4.6?

Quando (a) l'agente è il pianificatore / orchestratore e le decisioni hanno effetti a cascata, (b) l'esecuzione è abbastanza lunga da far iniziare Sonnet a perdere istruzioni, o (c) l'output deve applicarsi in modo pulito al primo tentativo (modifiche al codice, payload strutturati).

Dovrei migrare da Opus 4.6 a Opus 4.7?

Sì. Anthropic raccomanda esplicitamente 4.7 rispetto a 4.6. Stesso moltiplicatore, comportamento più solido. Migra gli agenti di produzione bloccati su una versione solo dopo averli fatti passare dalla tua suite di regressione.

Opus 4.7 supporta il prompt caching?

Sì. L'input in cache è fatturato a $0,50 per 1M di token. Uno sconto di 10× sulla porzione in cache. Vale la pena usarlo ogni volta che il prompt di sistema o lo schema degli strumenti è stabile tra le chiamate.

Alternative

Claude Opus 4.8

Modello di punta più recente per agenti ad alto rischio

Claude Sonnet 4.6

Predefinito più economico per la maggior parte dei loop agentici

Kimi K2.7 Code

Alternativa di coding open-weight a risparmio di costo

Usare Claude Opus 4.7 su VM0

Due modi per accedere a Claude Opus 4.7 su VM0

VM0 supporta Claude Opus 4.7 come modello Built-in fatturato in crediti VM0 e tramite bring-your-own con una Anthropic API key. Il percorso Built-in usa il routing VM0 Managed e il moltiplicatore di crediti spiegato di seguito; il percorso bring-your-own ti fattura direttamente con il fornitore upstream e salta del tutto la conversione in crediti VM0.

La raccomandazione di VM0

VM0 posiziona Claude Opus 4.7 come modello agente core, consigliato insieme a Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6 per i passi che determinano il risultato effettivo di un'esecuzione di un agente. Sono i modelli che sceglieremmo per il ruolo di orchestratore, per gli agenti che toccano il codice e per qualsiasi passo in cui una risposta sbagliata è costosa.

Crediti e il moltiplicatore ×2

Ogni modello Built-in su VM0 è prezzato come un multiplo di Claude Sonnet 4.6, che si colloca alla baseline di crediti ×1. Claude Opus 4.7 viene fatturato a ×2 crediti. Il moltiplicatore è ciò che compare sulla tua fattura VM0; il prezzo di listino del fornitore nella tabella prezzi sopra è ciò che il provider upstream addebita prima che VM0 lo converta in crediti.

Claude Opus 4.7 viene fatturato a ×2, il che significa che un passo qui costa 2× i crediti di un passo equivalente su Sonnet 4.6 (la baseline ×1). È un tier premium su VM0, quindi il pattern conveniente è quello di usare come predefinito un modello più economico e indirizzare a Claude Opus 4.7 solo i passi che hanno davvero bisogno della profondità di ragionamento aggiuntiva.

Disponibile su VM0 dal April 17, 2026.