Claude Sonnet 4.6 su VM0. Il modello predefinito per gli agenti

Il predefinito per la maggior parte degli agenti VM0. Routing degli strumenti solido, buon comportamento long-context e la baseline del credito. Ogni altro modello è prezzato in rapporto a Sonnet 4.6.

1M tokens · Text / Vision / Code · Prompt cache

Usa Claude Sonnet 4.6 su VM0

Claude Sonnet 4.6 è il cavallo di battaglia della famiglia Claude 4 e il modello Built-in predefinito su VM0. Sceglie lo strumento giusto con gli argomenti giusti in modo più affidabile di qualsiasi cosa più economica, resta coerente su conversazioni di centinaia di migliaia di token e la maggior parte degli agenti di produzione — triage su Slack, revisione di PR su GitHub, supporto clienti — non ha mai bisogno di essere promossa oltre.

Il prezzo di listino vendor è di $3 / $15 per 1M di token, con l'input in cache che scende a $0,30 / 1M. Ricorri a Opus solo quando Sonnet fallisce visibilmente sul ragionamento più difficile, e a Kimi K2.7 Code o GPT-5.4 Mini quando domina il costo unitario.

Cos'è Claude Sonnet 4.6?

Febbraio 2026 (generazione Claude 4.6) · Fascia media della famiglia Claude 4. Il cavallo di battaglia di Anthropic, posizionato tra i modelli a risparmio di costo e Opus.

Claude Sonnet 4.6 si colloca al centro della famiglia Claude 4 di Anthropic. È il cavallo di battaglia progettato per gestire l'intera ampiezza del tipico lavoro degli agenti. Routing multi-strumento, modifiche al codice, conversazioni di lunga durata e task con structured output. Senza il premio di costo di Opus.

In tutta la gamma Built-in di VM0, il moltiplicatore di credito di ogni altro modello è normalizzato rispetto a Sonnet 4.6 (×1). Questo rende Sonnet la scelta giusta quando vuoi conversazioni di budget prevedibili: "questo agente gira a circa 2× un passaggio di Sonnet" è una frase più utile di preventivi in dollari assoluti che cambiano ogni trimestre.

Sonnet 4.6 supporta il prompt caching di Anthropic, che fa una grande differenza per gli agenti VM0 che spediscono un prompt di sistema stabile e uno schema di strumenti fisso. I token di input in cache sono fatturati a $0,30 per 1M invece di $3. Un risparmio di 10× sulle parti del prompt che non cambiano tra i turni.

Cosa rende notevole Claude Sonnet 4.6

Caratteristiche principali di architettura e capacità.

Sonnet 4.6 viene fornito con la finestra di contesto da 1M di token a prezzo standard, il ragionamento adattivo ereditato da Opus 4.6 e il prompt caching che fattura l'input in cache a un decimo della tariffa input. Accetta input multimodale su testo, visione e codice.

Specifiche in breve

FamigliaGenerazione Claude 4

ModalitàTesto, visione, codice

LinguePrima l'inglese, multilingue

Prompt cachingSupportato (Anthropic)

Finestra di contesto1M di token

Output massimoFino a 64K token

Predefinito perVM0 Managed

Benchmark di Claude Sonnet 4.6

Sonnet 4.6 si colloca circa 3-4 punti percentuali dietro Opus 4.6 sui benchmark di coding di punta di Anthropic, pur essendo da tre a cinque volte più economico a livello vendor. Il tipico compromesso Opus/Sonnet.

SWE-bench Verifieddichiarato dal vendor

~77%

Richiamo long-contextosservazione interna

Solido oltre i 100K

Routing degli strumentiinterno VM0

Il migliore della categoria a ×1

Prezzi di Claude Sonnet 4.6

Prezzo di listino del provider, per 1M di token.

Input$3.00

Output$15.00

Lettura cache$0.30

Scrittura cache$3.75

Come si comporta Claude Sonnet 4.6 nella pratica

Comportamento osservato dalle esecuzioni di agenti in produzione.

Routing degli strumenti

Accuratezza del routing degli strumenti la migliore della categoria a questo prezzo. Sui flussi multi-strumento tra Slack, GitHub, Linear e Notion, Sonnet 4.6 sceglie lo strumento corretto con gli argomenti corretti in modo più affidabile di qualsiasi modello sotto ×2.

Coerenza long-context

Coerente su trascrizioni oltre i 100K token. Scende sotto Opus 4.7 solo sulle esecuzioni più lunghe e avverse.

Velocità

Più veloce di Opus e più lento di Kimi K2.7 Code. Il giusto equilibrio velocità/qualità per gli agenti di produzione.

Prevedibilità dei costi

Il prezzo è la baseline del credito; il prompt caching rende il costo su VM0 particolarmente prevedibile per gli agenti con prompt di sistema fissi.

I migliori task per agenti con Claude Sonnet 4.6

L'agente Slack che sa dove stanno le cose

Fa il triage delle domande in arrivo, segue i thread bloccati, pubblica aggiornamenti di stato e risponde a query di tipo ricerca ("chi sta gestendo il refactor dell'auth?"). L'accuratezza del routing degli strumenti di Sonnet fa sì che lo strumento giusto venga chiamato con gli argomenti giusti al primo colpo, anche quando la richiesta è ambigua, così l'agente risulta affidabile invece che incostante.

L'agente di revisione PR che non annega nel rumore

Sonnet gestisce il grosso del lavoro consapevole del codice — revisione di PR, scaffolding dei test, suggerimenti di refactor, bisezione dei bug — senza lasciare commenti stilistici che nessuno ha chiesto. La finestra di contesto da 1M di token gli permette di tirare dentro i file correlati e le revisioni precedenti quando serve, e fai escalation a Opus 4.7 solo per le patch su cui Sonnet fatica visibilmente.

L'agente di ricerca che fa 20 chiamate a strumenti di fila

GitHub più Linear più Notion più il web, cuciti insieme su oltre venti turni di strumenti per rispondere a una domanda come "perché questo cliente ha abbandonato l'ultimo trimestre?". Sonnet mantiene l'obiettivo sotto controllo lungo l'intera catena a una frazione del costo di Opus, ed è ciò che lo rende sostenibile per la ricerca quotidiana invece che per approfondimenti una tantum.

L'assistente di supporto clienti con un prompt di sistema stabile

Lunghe cronologie di conversazione, frequenti chiamate a strumenti verso il CRM, lo stesso corposo prompt di sistema e schema di strumenti a ogni turno. Il prompt caching di Sonnet trasforma quel prefisso fisso in una frazione del costo di input dopo la prima chiamata, ed è ciò che mantiene piatto il costo per conversazione man mano che il volume cresce.

Quando evitare Claude Sonnet 4.6

Evita Sonnet 4.6 sui passaggi di ragionamento più difficili in cui perde visibilmente istruzioni e dovresti fare escalation a Opus 4.7, sulla classificazione di massa ad alto volume in cui GPT-5.4 Mini è l'opzione di massa supportata più economica, e sulle micro-risposte critiche per la latenza in cui Kimi K2.7 Code è sensibilmente più veloce.

Claude Sonnet 4.6 vs altri modelli

Claude Sonnet 4.6 vs Claude Opus 4.7

Sonnet 4.6 è ×1; Opus 4.7 è ×2. Sonnet gestisce la maggior parte degli agenti; Opus è l'aggiornamento quando la profondità di ragionamento conta più del throughput. Molti team usano Opus come pianificatore e Sonnet come worker.

Claude Sonnet 4.6 vs DeepSeek V4 Pro

DeepSeek V4 Pro (×0,1) eguaglia Sonnet sui benchmark di coding (SWE-bench Verified dichiarato dal vendor) a un costo molto inferiore. Il compromesso è un po' di affidabilità nel routing degli strumenti e un profilo di sicurezza meno maturo.

Claude Sonnet 4.6 vs GPT-5.4 Mini

GPT-5.4 Mini è l'opzione di massa più economica sul lato OpenAI. Usa Sonnet quando l'affidabilità del routing degli strumenti conta di più; usa Mini per il pre-filtraggio ad alto volume e per i passaggi semplici che non hanno bisogno di un routing di classe Sonnet.

In sintesi: dovresti usare Claude Sonnet 4.6?

Parti da qui. Migra in alto verso Opus 4.7 o in basso verso Kimi K2.7 Code / DeepSeek V4 Pro una volta visto il comportamento reale in produzione e capito quale direzione ha senso.

Domande frequenti

Perché Sonnet 4.6 è il modello predefinito su VM0 Managed?

Raggiunge il miglior equilibrio tra qualità di ragionamento, accuratezza del routing degli strumenti e costo della nostra gamma. I nuovi agenti funzionano quasi sempre su Sonnet senza ulteriore ottimizzazione.

Qual è la finestra di contesto di Claude Sonnet 4.6?

1 milione di token con fino a 64K token di output per risposta.

Sonnet 4.6 supporta l'input di immagini?

Sì. È multimodale. Testo, codice e immagini.

Quando dovrei abbandonare Sonnet 4.6?

Passa a Opus 4.7 se Sonnet perde visibilmente l'obiettivo sui lunghi loop agentici o fallisce su modifiche al codice difficili. Passa a Kimi K2.7 Code o GPT-5.4 Mini per i flussi semplici ad alto volume in cui domina il costo.

Sonnet 4.6 è lo stesso di Sonnet 4.5?

No. 4.6 è la generazione più recente della famiglia Claude 4 con miglior comportamento long-context e ragionamento adattivo. Il prezzo vendor per token è identico.

Alternative

Claude Opus 4.7

Usalo quando Sonnet raggiunge il suo limite di ragionamento

DeepSeek V4 Pro

Alternativa molto più economica a qualità di ragionamento simile

Usare Claude Sonnet 4.6 su VM0

Due modi per accedere a Claude Sonnet 4.6 su VM0

VM0 supporta Claude Sonnet 4.6 come modello Built-in fatturato in crediti VM0 e tramite bring-your-own con una Anthropic API key. Il percorso Built-in usa il routing VM0 Managed e il moltiplicatore di crediti spiegato di seguito; il percorso bring-your-own ti fattura direttamente con il fornitore upstream e salta del tutto la conversione in crediti VM0.

La raccomandazione di VM0

VM0 posiziona Claude Sonnet 4.6 come modello agente core, consigliato insieme a Claude Opus 4.7, Claude Opus 4.6 e Claude Sonnet 4.6 per i passi che determinano il risultato effettivo di un'esecuzione di un agente. Sono i modelli che sceglieremmo per il ruolo di orchestratore, per gli agenti che toccano il codice e per qualsiasi passo in cui una risposta sbagliata è costosa.

Crediti e il moltiplicatore ×1

Ogni modello Built-in su VM0 è prezzato come un multiplo di Claude Sonnet 4.6, che si colloca alla baseline di crediti ×1. Claude Sonnet 4.6 viene fatturato a ×1 crediti. Il moltiplicatore è ciò che compare sulla tua fattura VM0; il prezzo di listino del fornitore nella tabella prezzi sopra è ciò che il provider upstream addebita prima che VM0 lo converta in crediti.

Claude Sonnet 4.6 si colloca alla baseline ×1 rispetto alla quale è prezzato ogni altro modello Built-in, quindi è l'unità con cui confronti i costi quando scegli tra i modelli su VM0.

Disponibile su VM0 dal Available since launch.