Tous les modèles

Claude Sonnet 4.6 sur VM0. Le modèle d'agent par défaut

Le choix par défaut pour la plupart des agents VM0. Routage d'outils solide, bon comportement en contexte long, et la référence en crédits. Tous les autres modèles sont tarifés par rapport au Sonnet 4.6.

1M tokens · Text / Vision / Code · Prompt cache

Claude Sonnet 4.6 est le cheval de trait de la famille Claude 4 et le modèle intégré par défaut sur VM0. Il choisit le bon outil avec les bons arguments de façon plus fiable que tout ce qui est moins cher, reste cohérent sur des conversations de plusieurs centaines de milliers de tokens, et la plupart des agents en production — tri Slack, revue de PR GitHub, support client — n'ont jamais besoin d'être promus au-delà.

Le prix catalogue du fournisseur est de 3 $ / 15 $ par 1M de tokens, l'entrée mise en cache tombant à 0,30 $ / 1M. Ne recourez à l'Opus que lorsque le Sonnet échoue visiblement sur le raisonnement le plus difficile, et au Kimi K2.7 Code ou au GPT-5.4 Mini lorsque le coût unitaire prime.

Qu'est-ce que Claude Sonnet 4.6 ?

Février 2026 (génération Claude 4.6) · Milieu de gamme de la famille Claude 4. Le cheval de trait d'Anthropic, situé entre les modèles économiques et l'Opus.

Claude Sonnet 4.6 se situe au milieu de la famille Claude 4 d'Anthropic. C'est le cheval de trait conçu pour gérer toute l'étendue du travail d'agent typique : routage multi-outils, modifications de code, conversations de longue durée et tâches à sortie structurée. Sans la surcote de l'Opus.

Dans la gamme intégrée de VM0, le multiplicateur de crédits de tous les autres modèles est normalisé par rapport au Sonnet 4.6 (×1). Cela fait du Sonnet le bon choix lorsque vous voulez des discussions budgétaires prévisibles : « cet agent tourne à environ 2× une étape Sonnet » est une phrase plus utile que des montants absolus en dollars qui évoluent chaque trimestre.

Le Sonnet 4.6 prend en charge la mise en cache des prompts d'Anthropic, ce qui fait une grande différence pour les agents VM0 qui livrent un prompt système stable et un schéma d'outils fixe. Les tokens d'entrée mis en cache sont facturés 0,30 $ par 1M au lieu de 3 $. Une économie de 10× sur les parties du prompt qui ne changent pas d'un tour à l'autre.

Ce qui distingue Claude Sonnet 4.6

Principales caractéristiques d'architecture et de capacités.

Le Sonnet 4.6 est livré avec la fenêtre de contexte de 1M de tokens au tarif standard, le raisonnement adaptatif hérité de l'Opus 4.6, et une mise en cache des prompts facturant l'entrée mise en cache au dixième du tarif d'entrée. Il accepte des entrées multimodales : texte, vision et code.

Spécifications en un coup d'œil

FamilleGénération Claude 4
ModalitésTexte, vision, code
LanguesAnglais en priorité, multilingue
Mise en cache des promptsPrise en charge (Anthropic)
Fenêtre de contexte1M de tokens
Sortie maximaleJusqu'à 64K tokens
Par défaut pourVM0 Managed

Benchmarks de Claude Sonnet 4.6

Le Sonnet 4.6 se situe à environ 3 à 4 points de pourcentage derrière l'Opus 4.6 sur les principaux benchmarks de codage d'Anthropic, tout en étant trois à cinq fois moins cher au niveau fournisseur. Le compromis Opus/Sonnet habituel.

SWE-bench Verifiedcommuniqué par le fournisseur
~77 %
Rappel en contexte longobservation interne
Solide au-delà de 100K
Routage des outilsinterne VM0
Meilleur de sa catégorie à ×1

Tarification de Claude Sonnet 4.6

Prix catalogue fournisseur, par million de tokens.

Entrée$3.00
Sortie$15.00
Lecture cache$0.30
Écriture cache$3.75

Comment Claude Sonnet 4.6 se comporte en pratique

Comportement observé lors d'exécutions d'agents en production.

Routage des outils

Meilleure précision de routage d'outils de sa catégorie à ce prix. Sur les flux multi-outils couvrant Slack, GitHub, Linear et Notion, le Sonnet 4.6 choisit le bon outil avec les bons arguments de façon plus fiable que tout modèle en dessous de ×2.

Cohérence en contexte long

Cohérent sur des transcriptions de plus de 100K tokens. Ne passe sous l'Opus 4.7 que sur les exécutions les plus longues et les plus adverses.

Vitesse

Plus rapide que l'Opus et plus lent que le Kimi K2.7 Code. Le bon équilibre vitesse/qualité pour les agents en production.

Prévisibilité des coûts

Sa tarification est la référence en crédits ; la mise en cache des prompts rend le coût sur VM0 particulièrement prévisible pour les agents à prompts système fixes.

Meilleures tâches d'agent pour Claude Sonnet 4.6

L'agent Slack qui sait où se trouvent les choses

Trie les questions entrantes, relance les fils en suspens, publie des mises à jour de statut et répond aux requêtes de type recherche (« qui pilote le refactor de l'auth ? »). La précision de routage d'outils du Sonnet fait que le bon outil est appelé avec les bons arguments du premier coup, même quand la demande est ambiguë, si bien que l'agent paraît fiable plutôt qu'instable.

L'agent de revue de PR qui ne se noie pas dans le bruit

Le Sonnet gère l'essentiel du travail orienté code — revue de PR, échafaudage de tests, suggestions de refactorisation, bissection de bugs — sans laisser de commentaires stylistiques que personne n'a demandés. La fenêtre de contexte de 1M de tokens lui permet de rapatrier les fichiers liés et les revues antérieures quand cela compte, et vous n'escaladez vers l'Opus 4.7 que pour les correctifs où le Sonnet peine visiblement.

L'agent de recherche qui enchaîne 20 appels d'outils

GitHub plus Linear plus Notion plus le web, assemblés sur plus de vingt tours d'outils pour répondre à une question comme « pourquoi ce client a-t-il résilié le trimestre dernier ? ». Le Sonnet garde l'objectif en vue sur toute la chaîne pour une fraction du coût de l'Opus, ce qui le rend viable pour la recherche quotidienne, par opposition aux analyses approfondies ponctuelles.

L'assistant de support client avec un prompt système stable

De longs historiques de conversation, des appels d'outils fréquents vers le CRM, le même prompt système conséquent et le même schéma d'outils à chaque tour. La mise en cache des prompts du Sonnet transforme ce préfixe fixe en une fraction du coût d'entrée après le premier appel, ce qui maintient le coût par conversation stable à mesure que le volume augmente.

Quand éviter Claude Sonnet 4.6

Évitez le Sonnet 4.6 sur les étapes de raisonnement les plus difficiles où il laisse visiblement tomber des instructions et où vous devriez escalader vers l'Opus 4.7, sur la classification en masse à fort volume où le GPT-5.4 Mini est l'option groupée prise en charge la moins chère, et sur les micro-réponses critiques en latence où le Kimi K2.7 Code est nettement plus rapide.

Claude Sonnet 4.6 vs autres modèles

Claude Sonnet 4.6 vs Claude Opus 4.7

Le Sonnet 4.6 est en ×1 ; l'Opus 4.7 en ×2. Le Sonnet gère la plupart des agents ; l'Opus est la montée en gamme quand la profondeur de raisonnement compte plus que le débit. Beaucoup d'équipes utilisent l'Opus comme planificateur et le Sonnet comme exécutant.

Claude Sonnet 4.6 vs DeepSeek V4 Pro

DeepSeek V4 Pro (×0,1) égale le Sonnet sur les benchmarks de codage (SWE-bench Verified communiqué par le fournisseur) pour un coût bien moindre. Le compromis porte sur une certaine fiabilité du routage d'outils et un profil de sécurité moins mature.

Claude Sonnet 4.6 vs GPT-5.4 Mini

Le GPT-5.4 Mini est l'option groupée la moins chère côté OpenAI. Utilisez le Sonnet quand la fiabilité du routage d'outils prime ; utilisez le Mini pour le pré-filtrage à fort volume et les étapes simples qui n'exigent pas un routage de niveau Sonnet.

En résumé : devriez-vous utiliser Claude Sonnet 4.6 ?

Commencez ici. Montez vers l'Opus 4.7 ou descendez vers le Kimi K2.7 Code / DeepSeek V4 Pro une fois que vous avez observé le comportement réel en production et que vous savez quelle direction a du sens.

Questions fréquentes

Pourquoi le Sonnet 4.6 est-il le modèle par défaut sur VM0 Managed ?

Il offre le meilleur équilibre entre qualité de raisonnement, précision de routage d'outils et coût de notre gamme. Les nouveaux agents fonctionnent presque toujours sur le Sonnet sans réglage supplémentaire.

Quelle est la fenêtre de contexte de Claude Sonnet 4.6 ?

1 million de tokens, avec jusqu'à 64K tokens de sortie par réponse.

Le Sonnet 4.6 prend-il en charge l'entrée image ?

Oui. Il est multimodal. Texte, code et images.

Quand devrais-je abandonner le Sonnet 4.6 ?

Passez à l'Opus 4.7 si le Sonnet perd visiblement l'objectif sur de longues boucles d'agents ou échoue sur des modifications de code difficiles. Passez au Kimi K2.7 Code ou au GPT-5.4 Mini pour les flux simples à fort volume où le coût prime.

Le Sonnet 4.6 est-il identique au Sonnet 4.5 ?

Non. La 4.6 est la génération plus récente de la famille Claude 4, avec un meilleur comportement en contexte long et le raisonnement adaptatif. Le tarif fournisseur par token est identique.

Alternatives

Utiliser Claude Sonnet 4.6 sur VM0

Deux façons d'accéder à Claude Sonnet 4.6 sur VM0

VM0 prend en charge Claude Sonnet 4.6 comme modèle Built-in facturé en crédits VM0, et via le bring-your-own avec une Anthropic API key. La voie Built-in utilise le routage VM0 Managed et le multiplicateur de crédits expliqué ci-dessous ; la voie bring-your-own vous facture directement auprès du fournisseur en amont et contourne entièrement la conversion en crédits VM0.

La recommandation de VM0

VM0 positionne Claude Sonnet 4.6 comme un modèle d'agent central, recommandé aux côtés de Claude Opus 4.7, Claude Opus 4.6 et Claude Sonnet 4.6 pour les étapes qui déterminent le résultat réel d'une exécution d'agent. Ce sont les modèles que nous choisirions pour le rôle d'orchestrateur, pour les agents touchant au code, et pour toute étape où une mauvaise réponse coûte cher.

Les crédits et le multiplicateur ×1

Chaque modèle Built-in sur VM0 est tarifé comme un multiple de Claude Sonnet 4.6, qui se situe à la référence de crédits ×1. Claude Sonnet 4.6 est facturé à ×1 crédits. Le multiplicateur est ce qui apparaît sur votre facture VM0 ; le prix catalogue du fournisseur dans le tableau de tarification ci-dessus est ce que le fournisseur en amont facture avant que VM0 ne le convertisse en crédits.

Claude Sonnet 4.6 se situe à la référence ×1 par rapport à laquelle tous les autres modèles Built-in sont tarifés, c'est donc l'unité avec laquelle vous comparez les coûts au moment de choisir entre les modèles sur VM0.

Disponible sur VM0 depuis le Available since launch.