DeepSeek V4 Pro su VM0. Ragionamento ottimizzato per i costi
Il modello di ragionamento di punta V4 di DeepSeek. Entro 0,2 punti da Claude Opus 4.6 su SWE-bench Verified a un settimo del costo del vendor. API compatibile con Claude.
1M tokens · Text / Code · Prompt cache
DeepSeek V4 Pro è il modello di punta della generazione V4 di DeepSeek: un MoE open-weight da 1,6T parametri sotto licenza MIT. Il punto centrale è il rapporto prezzo-qualità: lo SWE-bench Verified riportato dal vendor è dell'80,6%, entro una frazione di punto da Claude Opus 4.6, a circa un settimo del costo del vendor di Anthropic. Questo rende gli agenti a forte ragionamento — revisione di PR in blocco, analisi di documenti in batch, riepiloghi pianificati — accessibili ad alto volume.
Il prezzo di listino del vendor è di $1,74 / $3,48 per 1M di token, con letture dalla cache a $0,028 / 1M e scritture in cache gratuite (unico nella gamma). Contesto da 1M di token, API compatibile con Anthropic. Affidati a Sonnet 4.6 quando l'affidabilità del routing degli strumenti in produzione è il fattore decisivo, e a GPT-5.4 Mini o Kimi K2.7 Code quando il lavoro in blocco a colpo singolo non richiede la profondità di ragionamento di V4 Pro.
Cos'è DeepSeek V4 Pro?
24 aprile 2026 · Variante di ragionamento della famiglia DeepSeek V4, focalizzata sulla massima qualità del ragionamento.
DeepSeek V4 Pro è il modello di punta della generazione V4 di DeepSeek, rilasciato il 24 aprile 2026 sotto licenza MIT. È un modello Mixture-of-Experts open-weight con 1,6T di parametri totali e 49B attivi per token.
V4 Pro supporta una finestra di contesto da 1M di token, un output massimo di 384K, tre modalità di sforzo di ragionamento (standard, think, think-max), output JSON, chiamate a strumenti e completamento FIM in modalità non-think. Il modello Pro aggiunge un'architettura di attenzione ibrida (Compressed Sparse Attention + Heavily Compressed Attention) per un'efficienza a contesto lungo drasticamente migliorata. Il 27% dei FLOP di inferenza per singolo token e il 10% della cache KV rispetto a DeepSeek V3.2 con contesto da 1M.
DeepSeek ha fatto scalpore nel 2025 offrendo ragionamento di livello Anthropic a una frazione del prezzo. V4 Pro prosegue questo schema: lo SWE-bench Verified riportato dal vendor dell'80,6% si colloca entro 0,2 punti da Claude Opus 4.6, a circa un settimo del costo del vendor. Su VM0 è esposto tramite il provider con chiave API DeepSeek e su VM0 Managed a ×0,1. Moltiplicatore più basso di Kimi K2.7 Code, con un comportamento di ragionamento sostanzialmente più forte.
Cosa rende notevole DeepSeek V4 Pro
Caratteristiche principali di architettura e capacità.
V4 Pro è un modello Mixture-of-Experts con 1,6T di parametri totali e 49B attivi per token, dotato di uno stack di attenzione ibrida (Compressed Sparse Attention più Heavily Compressed Attention) che mantiene bassa l'inferenza a contesto lungo. Supporta una finestra di contesto da 1M di token con un output massimo di 384K, tre modalità di sforzo di ragionamento (standard, think e think-max) e utilizza Manifold-Constrained Hyper-Connections per una propagazione stabile del segnale. Il modello è stato addestrato su oltre 32T di token con l'ottimizzatore Muon ed è rilasciato sotto licenza MIT con pesi open.
Specifiche in breve
Benchmark di DeepSeek V4 Pro
Punteggi riportati dal vendor tratti dal rilascio di V4 Pro di DeepSeek. Recensioni indipendenti (Geeky Gadgets, Code Arena) collocano V4 Pro al terzo posto su Code Arena dietro GLM-5.1 e Kimi K2.7 Code. Le affermazioni più forti sui benchmark provengono dai materiali di DeepSeek stessa. Da interpretare in modo direzionale piuttosto che come verità assoluta.
Prezzi di DeepSeek V4 Pro
Prezzo di listino del provider, per 1M di token.
Come si comporta DeepSeek V4 Pro nella pratica
Comportamento osservato dalle esecuzioni di agenti in produzione.
Ragionamento
Il ragionamento sub-Sonnet più forte della nostra gamma. Regge sul lavoro multi-step dove i modelli più economici iniziano a perdere il filo. L'MMLU-Pro riportato dal vendor è pari a GPT-5.4.
Benchmark di programmazione
SWE-bench Verified riportato dal vendor 80,6% (entro 0,2 da Opus 4.6), Terminal-Bench 2.0 67,9% (in testa a Opus 4.6), LiveCodeBench 93,5%.
Efficienza dei costi
La proprietà di spicco. Un costo in crediti ×0,1 con un ragionamento che compete bene con Sonnet 4.6 rende V4 Pro il predefinito per l'ottimizzazione dei costi, molto più economico di Claude Opus 4.7.
Economia della cache
Le scritture in cache sono gratuite. Unico tra i modelli Built-in di VM0. I prompt di sistema stabili e i grandi documenti di riferimento incollati non costano nulla in più da mettere in cache, viene fatturato solo il lato lettura.
Velocità
Circa 36 token/sec al massimo sforzo secondo Artificial Analysis. Più lento di Kimi K2.7 Code, leggermente più lento di Opus 4.6.
I migliori task per agenti con DeepSeek V4 Pro
L'agente di revisione PR che gira a ogni commit
Una precisione di livello Sonnet a una frazione del costo del vendor di Sonnet è ciò che rende davvero praticabile il "rivedi ogni commit, non solo le grandi PR". V4 Pro legge il diff, i file correlati e l'issue collegata, poi scrive un commento strutturato — e il prezzo per chiamata è abbastanza basso da far sì che eseguirlo come step di CI a ogni push non si presenti come una voce di costo significativa.
Il riepilogatore pianificato che gira ogni notte
Raccoglie le conversazioni con i clienti del giorno prima, i ticket di supporto o le chiamate di vendita e scrive un digest. Il prompt di sistema e lo schema degli strumenti non cambiano tra un'esecuzione e l'altra, e DeepSeek non fattura le scritture in cache — quindi il lungo prefisso fisso si paga una sola volta e le letture in cache costano una frazione dell'input normale. È qui che il modello di prezzo di V4 Pro cambia davvero ciò che è accessibile.
L'agente di codice sull'intero repository che costa meno di Opus
Un contesto da 1M di token con attenzione ibrida (Compressed Sparse Attention più Heavily Compressed Attention) significa che una codebase di medie dimensioni entra in un solo prompt e il costo di inferenza resta gestibile man mano che la finestra si riempie. Per refactoring cross-file e revisioni a livello di architettura, è qui che ottieni il flusso di lavoro in stile Opus del "vedere tutto in una volta" senza la fattura in stile Opus.
Quando evitare DeepSeek V4 Pro
Evita V4 Pro sui casi limite più difficili di routing degli strumenti, dove Sonnet 4.6 resta in testa, e sul lavoro in blocco a colpo singolo dove GPT-5.4 Mini o Kimi K2.7 Code è sufficiente a costo inferiore.
DeepSeek V4 Pro vs altri modelli
DeepSeek V4 Pro vs Claude Sonnet 4.6
Sonnet 4.6 (×1) vince sui casi limite del routing degli strumenti e sul ragionamento in lingua inglese. V4 Pro (×0,1) vince sui costi ed è competitivo sui benchmark di programmazione (riportati dal vendor). Vale la pena fare un test A/B su un agente reale prima di impegnarsi.
DeepSeek V4 Pro vs Kimi K2.7 Code
Moltiplicatore più basso di Kimi (×0,1 contro ×0,3). Kimi ha un richiamo a contesto lungo più forte e un Intelligence Index più alto (54 contro 52); V4 Pro ha una migliore economia della cache (scritture gratuite) e una finestra di contesto da 1M contro i 256K di Kimi. Scegli in base a quale proprietà conta di più.
DeepSeek V4 Pro vs GLM-5.2
GLM-5.2 è l'attuale rotta predefinita di Z.AI su VM0. È il confronto migliore per i nuovi agenti basati su Z.AI, mentre GLM-5.1 resta disponibile solo per compatibilità con i flussi di lavoro ottimizzati.
In sintesi: dovresti usare DeepSeek V4 Pro?
Pre-filtra con GPT-5.4 Mini o Kimi K2.7 Code, scala a V4 Pro per il ragionamento, scala a Sonnet 4.6 solo quando V4 Pro si blocca sui casi limite del routing degli strumenti.
Domande frequenti
Quando è stato rilasciato DeepSeek V4 Pro?
DeepSeek ha rilasciato V4 Pro il 24 aprile 2026 sotto licenza MIT con pesi open.
Perché le scritture in cache sono gratuite?
DeepSeek non fattura la parte di scrittura in cache. Vengono fatturate solo le letture in cache, a $0,145 per 1M di token. I prompt di sistema stabili e i grandi contesti di riferimento non costano nulla in più da mettere in cache.
Qual è la finestra di contesto di V4 Pro?
1 milione di token con fino a 384K token di output. L'architettura di attenzione ibrida rende l'intera finestra utilizzabile a un costo di inferenza molto più basso rispetto a V3.2.
Come si confronta V4 Pro con Claude Opus 4.6?
Lo SWE-bench Verified riportato dal vendor è entro 0,2 punti (80,6 contro 80,8). Terminal-Bench 2.0 favorisce V4 Pro (67,9 contro 65,4). Opus 4.6 è in testa su HLE (40,0 contro 37,7) e sulla matematica HMMT 2026 (96,2 contro 95,2). A un costo del vendor circa 7× inferiore, V4 Pro è la scelta giusta quando la qualità del ragionamento è il requisito ma i costi contano.
V4 Pro è open-source?
Sì. I pesi sono pubblicati sotto licenza MIT. L'API DeepSeek ospitata è la rotta di produzione per VM0.
Alternative
Usare DeepSeek V4 Pro su VM0
Due modi per accedere a DeepSeek V4 Pro su VM0
VM0 supporta DeepSeek V4 Pro come modello Built-in fatturato in crediti VM0 e tramite bring-your-own con una DeepSeek API key. Il percorso Built-in usa il routing VM0 Managed e il moltiplicatore di crediti spiegato di seguito; il percorso bring-your-own ti fattura direttamente con il fornitore upstream e salta del tutto la conversione in crediti VM0.
La raccomandazione di VM0
VM0 posiziona DeepSeek V4 Pro come opzione per risparmiare sui costi anziché come modello agente core. Usalo per ottimizzare il costo unitario sul lavoro non-core, come classificazione in blocco, pre-filtri, risposte brevi critiche per la latenza o agenti legacy fissati, mantenendo Claude Opus 4.7, Claude Opus 4.6 o Claude Sonnet 4.6 sui passi che decidono l'esecuzione.
Crediti e il moltiplicatore ×0.1
Ogni modello Built-in su VM0 è prezzato come un multiplo di Claude Sonnet 4.6, che si colloca alla baseline di crediti ×1. DeepSeek V4 Pro viene fatturato a ×0.1 crediti. Il moltiplicatore è ciò che compare sulla tua fattura VM0; il prezzo di listino del fornitore nella tabella prezzi sopra è ciò che il provider upstream addebita prima che VM0 lo converta in crediti.
DeepSeek V4 Pro viene fatturato a ×0.1, il che significa che un passo qui costa solo 0.1× i crediti di un passo equivalente su Sonnet 4.6 (la baseline ×1). Questo lo colloca ben al di sotto della baseline di crediti e lo rende la scelta naturale per il lavoro di background ad alto volume, dove il costo per passo conta più della qualità di ragionamento di picco.
Disponibile su VM0 dal April 24, 2026.