Claude Sonnet 4.6 sur VM0. Le modèle d'agent par défaut
Le choix par défaut pour la plupart des agents VM0. Routage d'outils solide, bon comportement en contexte long, et la référence en crédits. Tous les autres modèles sont tarifés par rapport au Sonnet 4.6.
1M tokens · Text / Vision / Code · Prompt cache
Claude Sonnet 4.6 est le cheval de trait de la famille Claude 4 et le modèle intégré par défaut sur VM0. Il choisit le bon outil avec les bons arguments de façon plus fiable que tout ce qui est moins cher, reste cohérent sur des conversations de plusieurs centaines de milliers de tokens, et la plupart des agents en production — tri Slack, revue de PR GitHub, support client — n'ont jamais besoin d'être promus au-delà.
Le prix catalogue du fournisseur est de 3 $ / 15 $ par 1M de tokens, l'entrée mise en cache tombant à 0,30 $ / 1M. Ne recourez à l'Opus que lorsque le Sonnet échoue visiblement sur le raisonnement le plus difficile, et au Kimi K2.7 Code ou au GPT-5.4 Mini lorsque le coût unitaire prime.
Qu'est-ce que Claude Sonnet 4.6 ?
Février 2026 (génération Claude 4.6) · Milieu de gamme de la famille Claude 4. Le cheval de trait d'Anthropic, situé entre les modèles économiques et l'Opus.
Claude Sonnet 4.6 se situe au milieu de la famille Claude 4 d'Anthropic. C'est le cheval de trait conçu pour gérer toute l'étendue du travail d'agent typique : routage multi-outils, modifications de code, conversations de longue durée et tâches à sortie structurée. Sans la surcote de l'Opus.
Dans la gamme intégrée de VM0, le multiplicateur de crédits de tous les autres modèles est normalisé par rapport au Sonnet 4.6 (×1). Cela fait du Sonnet le bon choix lorsque vous voulez des discussions budgétaires prévisibles : « cet agent tourne à environ 2× une étape Sonnet » est une phrase plus utile que des montants absolus en dollars qui évoluent chaque trimestre.
Le Sonnet 4.6 prend en charge la mise en cache des prompts d'Anthropic, ce qui fait une grande différence pour les agents VM0 qui livrent un prompt système stable et un schéma d'outils fixe. Les tokens d'entrée mis en cache sont facturés 0,30 $ par 1M au lieu de 3 $. Une économie de 10× sur les parties du prompt qui ne changent pas d'un tour à l'autre.
Ce qui distingue Claude Sonnet 4.6
Principales caractéristiques d'architecture et de capacités.
Le Sonnet 4.6 est livré avec la fenêtre de contexte de 1M de tokens au tarif standard, le raisonnement adaptatif hérité de l'Opus 4.6, et une mise en cache des prompts facturant l'entrée mise en cache au dixième du tarif d'entrée. Il accepte des entrées multimodales : texte, vision et code.
Spécifications en un coup d'œil
Benchmarks de Claude Sonnet 4.6
Le Sonnet 4.6 se situe à environ 3 à 4 points de pourcentage derrière l'Opus 4.6 sur les principaux benchmarks de codage d'Anthropic, tout en étant trois à cinq fois moins cher au niveau fournisseur. Le compromis Opus/Sonnet habituel.
Tarification de Claude Sonnet 4.6
Prix catalogue fournisseur, par million de tokens.
Comment Claude Sonnet 4.6 se comporte en pratique
Comportement observé lors d'exécutions d'agents en production.
Routage des outils
Meilleure précision de routage d'outils de sa catégorie à ce prix. Sur les flux multi-outils couvrant Slack, GitHub, Linear et Notion, le Sonnet 4.6 choisit le bon outil avec les bons arguments de façon plus fiable que tout modèle en dessous de ×2.
Cohérence en contexte long
Cohérent sur des transcriptions de plus de 100K tokens. Ne passe sous l'Opus 4.7 que sur les exécutions les plus longues et les plus adverses.
Vitesse
Plus rapide que l'Opus et plus lent que le Kimi K2.7 Code. Le bon équilibre vitesse/qualité pour les agents en production.
Prévisibilité des coûts
Sa tarification est la référence en crédits ; la mise en cache des prompts rend le coût sur VM0 particulièrement prévisible pour les agents à prompts système fixes.
Meilleures tâches d'agent pour Claude Sonnet 4.6
L'agent Slack qui sait où se trouvent les choses
Trie les questions entrantes, relance les fils en suspens, publie des mises à jour de statut et répond aux requêtes de type recherche (« qui pilote le refactor de l'auth ? »). La précision de routage d'outils du Sonnet fait que le bon outil est appelé avec les bons arguments du premier coup, même quand la demande est ambiguë, si bien que l'agent paraît fiable plutôt qu'instable.
L'agent de revue de PR qui ne se noie pas dans le bruit
Le Sonnet gère l'essentiel du travail orienté code — revue de PR, échafaudage de tests, suggestions de refactorisation, bissection de bugs — sans laisser de commentaires stylistiques que personne n'a demandés. La fenêtre de contexte de 1M de tokens lui permet de rapatrier les fichiers liés et les revues antérieures quand cela compte, et vous n'escaladez vers l'Opus 4.7 que pour les correctifs où le Sonnet peine visiblement.
L'agent de recherche qui enchaîne 20 appels d'outils
GitHub plus Linear plus Notion plus le web, assemblés sur plus de vingt tours d'outils pour répondre à une question comme « pourquoi ce client a-t-il résilié le trimestre dernier ? ». Le Sonnet garde l'objectif en vue sur toute la chaîne pour une fraction du coût de l'Opus, ce qui le rend viable pour la recherche quotidienne, par opposition aux analyses approfondies ponctuelles.
L'assistant de support client avec un prompt système stable
De longs historiques de conversation, des appels d'outils fréquents vers le CRM, le même prompt système conséquent et le même schéma d'outils à chaque tour. La mise en cache des prompts du Sonnet transforme ce préfixe fixe en une fraction du coût d'entrée après le premier appel, ce qui maintient le coût par conversation stable à mesure que le volume augmente.
Quand éviter Claude Sonnet 4.6
Évitez le Sonnet 4.6 sur les étapes de raisonnement les plus difficiles où il laisse visiblement tomber des instructions et où vous devriez escalader vers l'Opus 4.7, sur la classification en masse à fort volume où le GPT-5.4 Mini est l'option groupée prise en charge la moins chère, et sur les micro-réponses critiques en latence où le Kimi K2.7 Code est nettement plus rapide.
Claude Sonnet 4.6 vs autres modèles
Claude Sonnet 4.6 vs Claude Opus 4.7
Le Sonnet 4.6 est en ×1 ; l'Opus 4.7 en ×2. Le Sonnet gère la plupart des agents ; l'Opus est la montée en gamme quand la profondeur de raisonnement compte plus que le débit. Beaucoup d'équipes utilisent l'Opus comme planificateur et le Sonnet comme exécutant.
Claude Sonnet 4.6 vs DeepSeek V4 Pro
DeepSeek V4 Pro (×0,1) égale le Sonnet sur les benchmarks de codage (SWE-bench Verified communiqué par le fournisseur) pour un coût bien moindre. Le compromis porte sur une certaine fiabilité du routage d'outils et un profil de sécurité moins mature.
Claude Sonnet 4.6 vs GPT-5.4 Mini
Le GPT-5.4 Mini est l'option groupée la moins chère côté OpenAI. Utilisez le Sonnet quand la fiabilité du routage d'outils prime ; utilisez le Mini pour le pré-filtrage à fort volume et les étapes simples qui n'exigent pas un routage de niveau Sonnet.
En résumé : devriez-vous utiliser Claude Sonnet 4.6 ?
Commencez ici. Montez vers l'Opus 4.7 ou descendez vers le Kimi K2.7 Code / DeepSeek V4 Pro une fois que vous avez observé le comportement réel en production et que vous savez quelle direction a du sens.
Questions fréquentes
Pourquoi le Sonnet 4.6 est-il le modèle par défaut sur VM0 Managed ?
Il offre le meilleur équilibre entre qualité de raisonnement, précision de routage d'outils et coût de notre gamme. Les nouveaux agents fonctionnent presque toujours sur le Sonnet sans réglage supplémentaire.
Quelle est la fenêtre de contexte de Claude Sonnet 4.6 ?
1 million de tokens, avec jusqu'à 64K tokens de sortie par réponse.
Le Sonnet 4.6 prend-il en charge l'entrée image ?
Oui. Il est multimodal. Texte, code et images.
Quand devrais-je abandonner le Sonnet 4.6 ?
Passez à l'Opus 4.7 si le Sonnet perd visiblement l'objectif sur de longues boucles d'agents ou échoue sur des modifications de code difficiles. Passez au Kimi K2.7 Code ou au GPT-5.4 Mini pour les flux simples à fort volume où le coût prime.
Le Sonnet 4.6 est-il identique au Sonnet 4.5 ?
Non. La 4.6 est la génération plus récente de la famille Claude 4, avec un meilleur comportement en contexte long et le raisonnement adaptatif. Le tarif fournisseur par token est identique.
Alternatives
Utiliser Claude Sonnet 4.6 sur VM0
Deux façons d'accéder à Claude Sonnet 4.6 sur VM0
VM0 prend en charge Claude Sonnet 4.6 comme modèle Built-in facturé en crédits VM0, et via le bring-your-own avec une Anthropic API key. La voie Built-in utilise le routage VM0 Managed et le multiplicateur de crédits expliqué ci-dessous ; la voie bring-your-own vous facture directement auprès du fournisseur en amont et contourne entièrement la conversion en crédits VM0.
La recommandation de VM0
VM0 positionne Claude Sonnet 4.6 comme un modèle d'agent central, recommandé aux côtés de Claude Opus 4.7, Claude Opus 4.6 et Claude Sonnet 4.6 pour les étapes qui déterminent le résultat réel d'une exécution d'agent. Ce sont les modèles que nous choisirions pour le rôle d'orchestrateur, pour les agents touchant au code, et pour toute étape où une mauvaise réponse coûte cher.
Les crédits et le multiplicateur ×1
Chaque modèle Built-in sur VM0 est tarifé comme un multiple de Claude Sonnet 4.6, qui se situe à la référence de crédits ×1. Claude Sonnet 4.6 est facturé à ×1 crédits. Le multiplicateur est ce qui apparaît sur votre facture VM0 ; le prix catalogue du fournisseur dans le tableau de tarification ci-dessus est ce que le fournisseur en amont facture avant que VM0 ne le convertisse en crédits.
Claude Sonnet 4.6 se situe à la référence ×1 par rapport à laquelle tous les autres modèles Built-in sont tarifés, c'est donc l'unité avec laquelle vous comparez les coûts au moment de choisir entre les modèles sur VM0.
Disponible sur VM0 depuis le Available since launch.