Claude Opus 4.6 su VM0

Il precedente modello di punta di Anthropic. Stesso moltiplicatore e contesto da 1M di Opus 4.7. Mantienilo bloccato solo quando un agente è stato validato su questa esatta versione.

1M tokens · Text / Vision / Code · Prompt cache

Usa Claude Opus 4.6 su VM0

Claude Opus 4.6 era il modello di punta di Anthropic prima di Opus 4.7 e ha introdotto gran parte di ciò che ora definisce la famiglia Claude 4: la finestra di contesto da 1M di token in beta, il ragionamento adattivo a quattro livelli di sforzo e i punteggi di coding agentico più alti mai pubblicati da Anthropic all'epoca (SWE-bench Verified 80,8%, Terminal-Bench 2.0 65,4%, OSWorld 72,7% dichiarati dal vendor).

Il prezzo di listino vendor è lo stesso $5 / $25 per 1M di token di 4.7. L'unico buon motivo per restare su 4.6 è la stabilità del comportamento per un agente già validato su questa versione; qualsiasi cosa nuova dovrebbe partire su 4.7.

Cos'è Claude Opus 4.6?

5 febbraio 2026 · Precedente vertice della famiglia Claude 4. Sostituito da Claude Opus 4.7.

Claude Opus 4.6 era il modello di frontiera di Anthropic prima di Opus 4.7. È stato rilasciato il 5 febbraio 2026 e ha introdotto diverse capacità che hanno definito la famiglia Claude 4. Il ragionamento adattivo con quattro livelli di sforzo, la finestra di contesto da 1M di token in beta e i punteggi di coding agentico più alti di Anthropic al lancio.

Su VM0 si colloca allo stesso moltiplicatore di credito ×2 di Opus 4.7. Anthropic raccomanda esplicitamente di migrare a 4.7 per il lavoro nuovo; blocca 4.6 solo se un agente specifico è stato validato su questa versione e non vuoi ancora rieseguire i test di regressione.

Cosa rende notevole Claude Opus 4.6

Caratteristiche principali di architettura e capacità.

Opus 4.6 ha introdotto il ragionamento adattivo con quattro livelli di sforzo (low, medium, high e max, con high come predefinito) e la finestra di contesto da 1M di token in beta a prezzo standard. Ha aggiunto una Compaction API per la sintesi del contesto lato server, ha disabilitato il prefilling come modifica non retrocompatibile rispetto a Opus 4.5 (usa gli structured output al suo posto) e ha introdotto un Mailbox Protocol per i team multi-agente peer-to-peer. Un parametro inference_geo espone l'inferenza solo USA a un moltiplicatore di 1,1×.

Specifiche in breve

FamigliaGenerazione Claude 4

ModalitàTesto, visione, codice

LinguePrima l'inglese, multilingue

Prompt cachingSupportato (Anthropic)

Finestra di contesto1M di token (beta)

Output massimoFino a 128K token

Disponibile su VM0Disponibile dal lancio

Benchmark di Claude Opus 4.6

Punteggi dichiarati dal vendor tratti dai materiali di rilascio di Opus 4.6 di Anthropic e da Artificial Analysis. Tratta con cautela i numeri assoluti di SWE-bench. OpenAI ha segnalato contaminazione dei dati di training su SWE-bench Verified per tutti i modelli di frontiera.

SWE-bench Verifieddichiarato dal vendor

80,8%

Terminal-Bench 2.0dichiarato dal vendor

65,4%

OSWorld (computer use)dichiarato dal vendor

72,7%

MRCR v2 (1M, 8-needle)dichiarato dal vendor

76%

Artificial Analysis Intelligence Indexsforzo massimo

VelocitàArtificial Analysis

~41 token/sec

Prezzi di Claude Opus 4.6

Prezzo di listino del provider, per 1M di token.

Input$15.00

Output$75.00

Lettura cache$1.50

Scrittura cache$18.75

Come si comporta Claude Opus 4.6 nella pratica

Comportamento osservato dalle esecuzioni di agenti in produzione.

Ragionamento

Solido sui passaggi di ragionamento difficili. Opus 4.7 è incrementalmente migliore a un costo vendor leggermente inferiore. Non c'è categoria di benchmark in cui 4.6 sia in testa.

Uso degli strumenti

Affidabile sui flussi di agenti multi-strumento. Stesso ordine di grandezza di Sonnet 4.6 sull'accuratezza del routing, con maggiore robustezza sui casi limite.

Contesto lungo

Contesto da 1M di token con richiamo MRCR v2 del 76%. Davvero utilizzabile su tutta la finestra, non solo sulla carta.

Velocità

Più lento di Sonnet 4.6 e di Kimi K2.7 Code; paragonabile a Opus 4.7. Circa 41 token/sec a sforzo massimo secondo Artificial Analysis.

I migliori task per agenti con Claude Opus 4.6

L'agente di produzione che si sta già ripagando

Il tuo team ha passato due settimane a ottimizzare prompt e schemi di strumenti su Opus 4.6, l'agente è live da un mese e i clienti sono soddisfatti. Bloccarlo su 4.6 mantiene il comportamento identico mentre decidi se l'aggiornamento a 4.7 valga un ciclo di rivalidazione, invece di lasciare che Anthropic aggiorni automaticamente il tuo traffico e sposti silenziosamente gli output sotto i tuoi piedi.

La baseline di regressione per un rollout di Opus 4.7

Esegui lo stesso set di prompt su 4.6 e 4.7 fianco a fianco, confronta gli output e decidi dove l'aggiornamento cambia davvero il comportamento prima di azionare l'interruttore in produzione. Stesso prezzo vendor, stesso moltiplicatore, interfaccia identica — l'unica cosa diversa sono i pesi del modello, che è esattamente ciò che ti serve quando vuoi isolare le regressioni.

Quando evitare Claude Opus 4.6

Non avviare nuovi agenti su Opus 4.6 a meno che tu non abbia un motivo concreto, poiché 4.7 viene proposto allo stesso moltiplicatore con un comportamento più solido e un prezzo di listino vendor inferiore. Per lo stesso motivo, qualsiasi cosa sensibile ai costi dovrebbe andare su 4.7.

Claude Opus 4.6 vs altri modelli

Claude Opus 4.6 vs Claude Opus 4.7

Stesso moltiplicatore ×2 e finestra di contesto da 1M. Opus 4.7 è più recente, più veloce e con un prezzo di listino vendor inferiore. Blocca 4.6 solo quando hai già investito nell'ottimizzazione su questa versione.

Claude Opus 4.6 vs Claude Sonnet 4.6

Sonnet 4.6 è ×1 e gestisce la maggior parte dei loop agentici. Ricorri a Opus solo quando Sonnet fallisce visibilmente. Di solito per l'orchestrazione o per modifiche al codice difficili.

Claude Opus 4.6 vs Kimi K2.7 Code

Kimi K2.7 Code (×0,3) supera di poco Opus 4.6 su SWE-bench Pro (58,6 contro 53,4 dichiarati dal vendor) ed è molto più economico. Opus 4.6 mantiene il vantaggio sul profilo di sicurezza ed è la scelta enterprise occidentale predefinita.

In sintesi: dovresti usare Claude Opus 4.6?

Bloccalo se l'hai già validato su di esso; altrimenti parti da Opus 4.7. La migrazione è un cambio di impostazione, non una riscrittura.

Domande frequenti

Quando è stato rilasciato Claude Opus 4.6?

Anthropic ha rilasciato Opus 4.6 il 5 febbraio 2026. Opus 4.7 è seguito poco dopo.

Dovrei migrare da Opus 4.6 a Opus 4.7?

Sì per il lavoro nuovo. Stesso moltiplicatore, stesso contesto da 1M, prezzo di listino vendor inferiore, comportamento più solido sui task di coding agentico. Migra gli agenti bloccati su una versione solo dopo averli fatti passare dalla tua suite di regressione.

Qual è la finestra di contesto di Claude Opus 4.6?

1 milione di token (beta) con fino a 128K token di output per risposta.

Perché Opus 4.6 è il predefinito sul provider con chiave API Anthropic?

Predefinito storico precedente al lancio di Opus 4.7. Puoi passare qualsiasi agente a Opus 4.7, Sonnet 4.6 o Kimi K2.7 Code in VM0 Impostazioni → Model Providers senza cambiare la chiave API.

Cos'è il ragionamento adattivo?

Un livello di scheduling che lascia a Claude decidere quanto calcolo di ragionamento spendere per turno. Quattro livelli. Low, medium, high, max. Con high come predefinito. Ha sostituito l'interruttore di extended thinking di Opus 4.5.

Alternative

Claude Opus 4.7

Più recente, costo vendor inferiore

Claude Sonnet 4.6

Baseline Sonnet a costo molto inferiore

Kimi K2.7 Code

Alternativa open-weight più economica sui benchmark agentici

Usare Claude Opus 4.6 su VM0

Due modi per accedere a Claude Opus 4.6 su VM0

VM0 supporta Claude Opus 4.6 come modello Built-in fatturato in crediti VM0 e tramite bring-your-own con una Anthropic API key. Il percorso Built-in usa il routing VM0 Managed e il moltiplicatore di crediti spiegato di seguito; il percorso bring-your-own ti fattura direttamente con il fornitore upstream e salta del tutto la conversione in crediti VM0.

La raccomandazione di VM0

VM0 posiziona Claude Opus 4.6 come modello agente core, consigliato insieme a Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6 per i passi che determinano il risultato effettivo di un'esecuzione di un agente. Sono i modelli che sceglieremmo per il ruolo di orchestratore, per gli agenti che toccano il codice e per qualsiasi passo in cui una risposta sbagliata è costosa.

Crediti e il moltiplicatore ×2

Ogni modello Built-in su VM0 è prezzato come un multiplo di Claude Sonnet 4.6, che si colloca alla baseline di crediti ×1. Claude Opus 4.6 viene fatturato a ×2 crediti. Il moltiplicatore è ciò che compare sulla tua fattura VM0; il prezzo di listino del fornitore nella tabella prezzi sopra è ciò che il provider upstream addebita prima che VM0 lo converta in crediti.

Claude Opus 4.6 viene fatturato a ×2, il che significa che un passo qui costa 2× i crediti di un passo equivalente su Sonnet 4.6 (la baseline ×1). È un tier premium su VM0, quindi il pattern conveniente è quello di usare come predefinito un modello più economico e indirizzare a Claude Opus 4.6 solo i passi che hanno davvero bisogno della profondità di ragionamento aggiuntiva.

Disponibile su VM0 dal Available since launch.