DeepSeek V4 Pro sur VM0. Un raisonnement optimisé en coût
Le modèle de raisonnement V4 phare de DeepSeek. À 0,2 point de Claude Opus 4.6 sur SWE-bench Verified pour un septième du coût éditeur. API compatible Claude.
1M tokens · Text / Code · Prompt cache
DeepSeek V4 Pro est le modèle phare de la génération V4 de DeepSeek — un MoE à poids ouverts de 1 600 milliards de paramètres sous licence MIT. L'argument central est le rapport prix/qualité : le SWE-bench Verified annoncé par l'éditeur est de 80,6 %, à une fraction de point de Claude Opus 4.6, pour environ un septième du coût éditeur d'Anthropic. Cela rend abordables, à fort volume, les agents intensifs en raisonnement — revue de PR en masse, analyse documentaire par lots, synthèse planifiée.
Le prix catalogue de l'éditeur est de 1,74 $ / 3,48 $ par million de tokens, avec des lectures de cache à 0,028 $ / 1M et des écritures de cache gratuites (unique dans la gamme). Contexte de 1 million de tokens, API compatible Anthropic. Optez pour Sonnet 4.6 lorsque la fiabilité du routage d'outils en production est le facteur décisif, et pour GPT-5.4 Mini ou Kimi K2.7 Code lorsque le travail en masse en un seul passage n'a pas besoin de la profondeur de raisonnement de V4 Pro.
Qu'est-ce que DeepSeek V4 Pro ?
24 avril 2026 · Variante de raisonnement de la famille DeepSeek V4, axée sur la qualité de raisonnement maximale.
DeepSeek V4 Pro est le modèle phare de la génération V4 de DeepSeek, sorti le 24 avril 2026 sous licence MIT. C'est un modèle Mixture-of-Experts à poids ouverts comptant 1 600 milliards de paramètres au total et 49 milliards actifs par token.
V4 Pro prend en charge une fenêtre de contexte de 1 million de tokens, une sortie maximale de 384K, trois modes d'effort de raisonnement (standard, think, think-max), la sortie JSON, les appels d'outils et la complétion FIM en mode non-think. Le modèle Pro ajoute une architecture d'attention hybride (Compressed Sparse Attention + Heavily Compressed Attention) pour une efficacité considérablement améliorée sur contexte long. 27 % des FLOPs d'inférence par token et 10 % du cache KV par rapport à DeepSeek V3.2 sur un contexte de 1M.
DeepSeek a marqué les esprits tout au long de 2025 en offrant un raisonnement de niveau Anthropic pour une fraction du prix. V4 Pro poursuit dans cette voie : le SWE-bench Verified de 80,6 % annoncé par l'éditeur se situe à 0,2 point de Claude Opus 4.6, pour environ un septième du coût éditeur. Sur VM0, il est accessible via le fournisseur à clé API DeepSeek et sur VM0 Managed à ×0,1. Multiplicateur plus bas que Kimi K2.7 Code, avec un comportement de raisonnement nettement plus fort.
Ce qui distingue DeepSeek V4 Pro
Principales caractéristiques d'architecture et de capacités.
V4 Pro est un modèle Mixture-of-Experts comptant 1 600 milliards de paramètres au total et 49 milliards actifs par token, avec une pile d'attention hybride (Compressed Sparse Attention plus Heavily Compressed Attention) qui maintient l'inférence sur contexte long à un coût réduit. Il prend en charge une fenêtre de contexte de 1 million de tokens avec une sortie maximale de 384K, trois modes d'effort de raisonnement (standard, think et think-max), et utilise des Manifold-Constrained Hyper-Connections pour une propagation stable du signal. Le modèle a été entraîné sur plus de 32 000 milliards de tokens avec l'optimiseur Muon et est publié sous licence MIT avec des poids ouverts.
Spécifications en un coup d'œil
Benchmarks de DeepSeek V4 Pro
Scores annoncés par l'éditeur, issus du lancement de V4 Pro par DeepSeek. Des analyses indépendantes (Geeky Gadgets, Code Arena) placent V4 Pro en troisième position sur Code Arena, derrière GLM-5.1 et Kimi K2.7 Code. Les revendications de benchmark les plus marquées proviennent des supports de DeepSeek lui-même. À considérer comme une indication de tendance plutôt que comme une vérité absolue.
Tarification de DeepSeek V4 Pro
Prix catalogue fournisseur, par million de tokens.
Comment DeepSeek V4 Pro se comporte en pratique
Comportement observé lors d'exécutions d'agents en production.
Raisonnement
Le meilleur raisonnement sous-Sonnet de notre gamme. Tient sur le travail multi-étapes là où les modèles moins chers commencent à dériver. Le MMLU-Pro annoncé par l'éditeur est à égalité avec GPT-5.4.
Benchmarks de codage
SWE-bench Verified 80,6 % annoncé par l'éditeur (à 0,2 d'Opus 4.6), Terminal-Bench 2.0 67,9 % (devance Opus 4.6), LiveCodeBench 93,5 %.
Efficience de coût
La propriété phare. Un coût ×0,1 crédit avec un raisonnement qui rivalise bien avec Sonnet 4.6 fait de V4 Pro le choix par défaut pour l'optimisation des coûts, bien moins cher que Claude Opus 4.7.
Économie du cache
Les écritures de cache sont gratuites. Unique parmi les modèles intégrés de VM0. Les prompts système stables et les grands documents de référence collés ne coûtent rien de plus à mettre en cache, seule la lecture est facturée.
Vitesse
Environ 36 tokens/s à effort maximal selon Artificial Analysis. Plus lent que Kimi K2.7 Code, légèrement plus lent qu'Opus 4.6.
Meilleures tâches d'agent pour DeepSeek V4 Pro
L'agent de revue de PR qui tourne à chaque commit
Une précision de niveau Sonnet pour une fraction du coût éditeur de Sonnet, c'est ce qui rend réellement viable de « réviser chaque commit, pas seulement les grosses PR ». V4 Pro lit le diff, les fichiers associés et l'issue liée, puis rédige un commentaire structuré — et le prix par appel est assez bas pour qu'en l'exécutant comme étape CI à chaque push, cela ne ressorte pas comme une ligne notable.
Le résumeur planifié qui tourne chaque nuit
Récupère les conversations clients, les tickets de support ou les appels commerciaux de la veille et rédige un condensé. Le prompt système et le schéma d'outils ne changent pas d'une exécution à l'autre, et DeepSeek ne facture pas les écritures de cache — si bien que le long préfixe fixe est payé une fois et que les lectures en cache coûtent une fraction d'une entrée normale. C'est là que le modèle tarifaire de V4 Pro change vraiment ce qui devient abordable.
L'agent de code à l'échelle du dépôt qui coûte moins qu'Opus
Un contexte de 1 million de tokens avec attention hybride (Compressed Sparse Attention plus Heavily Compressed Attention) signifie qu'une base de code de taille moyenne tient dans un seul prompt et que le coût d'inférence reste maîtrisable à mesure que la fenêtre se remplit. Pour les refactorings inter-fichiers et les revues au niveau de l'architecture, c'est là qu'on obtient le workflow « tout voir d'un coup » à la Opus sans la facture à la Opus.
Quand éviter DeepSeek V4 Pro
Évitez V4 Pro sur les cas limites les plus difficiles de routage d'outils, où Sonnet 4.6 conserve l'avantage, et sur le travail en masse en un seul passage où GPT-5.4 Mini ou Kimi K2.7 Code suffit à moindre coût.
DeepSeek V4 Pro vs autres modèles
DeepSeek V4 Pro vs Claude Sonnet 4.6
Sonnet 4.6 (×1) l'emporte sur les cas limites de routage d'outils et le raisonnement en anglais. V4 Pro (×0,1) l'emporte sur le coût et reste compétitif sur les benchmarks de codage (annoncés par l'éditeur). À tester en A/B sur un véritable agent avant de s'engager.
DeepSeek V4 Pro vs Kimi K2.7 Code
Multiplicateur plus bas que Kimi (×0,1 contre ×0,3). Kimi offre un meilleur rappel sur contexte long et un Intelligence Index plus élevé (54 contre 52) ; V4 Pro a une meilleure économie de cache (écritures gratuites) et une fenêtre de contexte de 1M contre 256K pour Kimi. Choisissez selon la propriété la plus importante pour vous.
DeepSeek V4 Pro vs GLM-5.2
GLM-5.2 est la voie Z.AI par défaut actuelle sur VM0. C'est la meilleure comparaison pour les nouveaux agents adossés à Z.AI, tandis que GLM-5.1 reste disponible uniquement pour la compatibilité avec les workflows ajustés.
En résumé : devriez-vous utiliser DeepSeek V4 Pro ?
Préfiltrez avec GPT-5.4 Mini ou Kimi K2.7 Code, escaladez vers V4 Pro pour le raisonnement, et escaladez vers Sonnet 4.6 uniquement lorsque V4 Pro cale sur des cas limites de routage d'outils.
Questions fréquentes
Quand DeepSeek V4 Pro est-il sorti ?
DeepSeek a publié V4 Pro le 24 avril 2026 sous licence MIT avec des poids ouverts.
Pourquoi les écritures de cache sont-elles gratuites ?
DeepSeek ne facture pas la partie écriture du cache. Seules les lectures de cache sont facturées, à 0,145 $ par million de tokens. Les prompts système stables et les grands contextes de référence ne coûtent rien de plus à mettre en cache.
Quelle est la fenêtre de contexte de V4 Pro ?
1 million de tokens avec jusqu'à 384K tokens de sortie. L'architecture d'attention hybride rend la fenêtre entière exploitable à un coût d'inférence bien inférieur à V3.2.
Comment V4 Pro se compare-t-il à Claude Opus 4.6 ?
Le SWE-bench Verified annoncé par l'éditeur est à 0,2 point (80,6 contre 80,8). Terminal-Bench 2.0 favorise V4 Pro (67,9 contre 65,4). Opus 4.6 mène sur HLE (40,0 contre 37,7) et les maths HMMT 2026 (96,2 contre 95,2). À un coût éditeur environ 7× inférieur, V4 Pro est le bon choix lorsque la qualité de raisonnement est l'exigence mais que le coût compte.
V4 Pro est-il open source ?
Oui. Les poids sont publiés sous licence MIT. L'API DeepSeek hébergée est la voie de production pour VM0.
Alternatives
Utiliser DeepSeek V4 Pro sur VM0
Deux façons d'accéder à DeepSeek V4 Pro sur VM0
VM0 prend en charge DeepSeek V4 Pro comme modèle Built-in facturé en crédits VM0, et via le bring-your-own avec une DeepSeek API key. La voie Built-in utilise le routage VM0 Managed et le multiplicateur de crédits expliqué ci-dessous ; la voie bring-your-own vous facture directement auprès du fournisseur en amont et contourne entièrement la conversion en crédits VM0.
La recommandation de VM0
VM0 positionne DeepSeek V4 Pro comme une option économique plutôt qu'un modèle d'agent central. Utilisez-le pour optimiser le coût unitaire sur le travail non central, comme la classification en masse, les pré-filtres, les réponses courtes critiques en latence, ou les agents legacy figés, tout en gardant Claude Opus 4.7, Claude Opus 4.6 ou Claude Sonnet 4.6 sur les étapes qui décident de l'exécution.
Les crédits et le multiplicateur ×0.1
Chaque modèle Built-in sur VM0 est tarifé comme un multiple de Claude Sonnet 4.6, qui se situe à la référence de crédits ×1. DeepSeek V4 Pro est facturé à ×0.1 crédits. Le multiplicateur est ce qui apparaît sur votre facture VM0 ; le prix catalogue du fournisseur dans le tableau de tarification ci-dessus est ce que le fournisseur en amont facture avant que VM0 ne le convertisse en crédits.
DeepSeek V4 Pro est facturé à ×0.1, ce qui signifie qu'une étape ici ne coûte que 0.1× les crédits d'une étape équivalente sur Sonnet 4.6 (la référence ×1). Cela le place bien en dessous de la référence de crédits et en fait le choix naturel pour du travail de fond à fort volume où le coût par étape compte plus que la qualité de raisonnement maximale.
Disponible sur VM0 depuis le April 24, 2026.