Claude Sonnet 4.6 na VM0. O modelo padrão para agentes

O padrão para a maioria dos agentes da VM0. Roteamento de ferramentas forte, bom comportamento em contexto longo e a baseline de créditos. Todos os outros modelos têm preço relativo ao Sonnet 4.6.

1M tokens · Text / Vision / Code · Prompt cache

Usar Claude Sonnet 4.6 na VM0

O Claude Sonnet 4.6 é o cavalo de batalha da família Claude 4 e o modelo Built-in padrão na VM0. Ele escolhe a ferramenta certa com os argumentos certos de forma mais confiável do que qualquer coisa mais barata, mantém a coerência ao longo de conversas de centenas de milhares de tokens e a maioria dos agentes em produção — triagem no Slack, revisão de PR no GitHub, suporte ao cliente — nunca precisa ser promovida além dele.

O preço de tabela do fornecedor é $3 / $15 por 1M tokens, com entrada em cache caindo para $0,30 / 1M. Recorra ao Opus apenas quando o Sonnet falhar visivelmente no raciocínio mais difícil, e ao Kimi K2.7 Code ou GPT-5.4 Mini quando o custo unitário for o que mais pesa.

O que é o Claude Sonnet 4.6?

Fevereiro de 2026 (geração Claude 4.6) · Intermediário da família Claude 4. O modelo cavalo de batalha da Anthropic, posicionado entre os modelos econômicos e o Opus.

O Claude Sonnet 4.6 fica no meio da família Claude 4 da Anthropic. É o modelo cavalo de batalha projetado para dar conta de toda a amplitude do trabalho típico de agente. Roteamento de múltiplas ferramentas, edições de código, conversas de longa duração e tarefas de structured output. Sem o sobrepreço do Opus.

Em toda a linha Built-in da VM0, o multiplicador de créditos de cada modelo é normalizado em relação ao Sonnet 4.6 (×1). Isso faz do Sonnet a escolha certa quando você quer conversas de orçamento previsíveis: “este agente roda a cerca de 2× uma etapa do Sonnet” é uma frase mais útil do que cotações absolutas em dólar que mudam a cada trimestre.

O Sonnet 4.6 suporta o cache de prompt da Anthropic, o que faz uma grande diferença para agentes da VM0 que enviam um system prompt estável e um schema de ferramentas fixo. Tokens de entrada em cache são cobrados a $0,30 por 1M em vez de $3. Uma economia de 10× nas partes do prompt que não mudam entre os turnos.

O que se destaca no Claude Sonnet 4.6

Principais recursos de arquitetura e capacidade.

O Sonnet 4.6 vem com a janela de contexto de 1M tokens a preço padrão, raciocínio adaptativo herdado do Opus 4.6 e cache de prompt que cobra a entrada em cache a um décimo da taxa de entrada. Ele aceita entrada multimodal entre texto, visão e código.

Especificações em resumo

FamíliaGeração Claude 4

ModalidadesTexto, visão, código

IdiomasFoco em inglês, multilíngue

Cache de promptCompatível (Anthropic)

Janela de contexto1M tokens

Saída máximaAté 64K tokens

Padrão paraVM0 Managed

Benchmarks do Claude Sonnet 4.6

O Sonnet 4.6 fica cerca de 3 a 4 pontos percentuais atrás do Opus 4.6 nos principais benchmarks de codificação da Anthropic, sendo de três a cinco vezes mais barato no nível do fornecedor. O trade-off típico entre Opus e Sonnet.

SWE-bench Verifiedreportado pelo fornecedor

~77%

Recall de contexto longoobservação interna

Forte acima de 100K

Roteamento de ferramentasinterno da VM0

Melhor da categoria a ×1

Preços do Claude Sonnet 4.6

Preço de tabela do provedor, por 1M de tokens.

Entrada$3.00

Saída$15.00

Leitura de cache$0.30

Escrita de cache$3.75

Como o Claude Sonnet 4.6 se comporta na prática

Comportamento observado em execuções de agentes em produção.

Roteamento de ferramentas

Melhor precisão de roteamento de ferramentas da categoria neste preço. Em fluxos com múltiplas ferramentas entre Slack, GitHub, Linear e Notion, o Sonnet 4.6 escolhe a ferramenta correta com os argumentos corretos de forma mais confiável do que qualquer modelo abaixo de ×2.

Coerência em contexto longo

Coerente em transcrições acima de 100K tokens. Cai abaixo do Opus 4.7 apenas nas execuções mais longas e adversariais.

Velocidade

Mais rápido que o Opus e mais lento que o Kimi K2.7 Code. O equilíbrio certo entre velocidade e qualidade para agentes em produção.

Previsibilidade de custo

O preço é a baseline de créditos; o cache de prompt torna o custo na VM0 especialmente previsível para agentes com system prompts fixos.

Melhores tarefas de agente para o Claude Sonnet 4.6

O agente de Slack que sabe onde as coisas estão

Tria perguntas que chegam, acompanha threads parados, posta atualizações de status e responde a consultas estilo busca ("quem está cuidando da refatoração do auth?"). A precisão de roteamento de ferramentas do Sonnet faz com que a ferramenta certa seja chamada com os argumentos certos na primeira tentativa, mesmo quando a solicitação é ambígua, então o agente parece confiável em vez de instável.

O agente de revisão de PR que não se afoga em ruído

O Sonnet dá conta da maior parte do trabalho com noção de código — revisão de PR, esqueleto de testes, sugestões de refatoração, bisecção de bugs — sem deixar comentários de estilo que ninguém pediu. A janela de contexto de 1M tokens permite que ele puxe os arquivos relacionados e revisões anteriores quando importa, e você só escala para o Opus 4.7 nos patches em que o Sonnet visivelmente tem dificuldade.

O agente de pesquisa que faz 20 chamadas de ferramenta em sequência

GitHub mais Linear mais Notion mais a web, costurados ao longo de mais de vinte turnos de ferramenta para responder a uma pergunta como "por que este cliente cancelou no trimestre passado?". O Sonnet mantém o objetivo em vista em toda a cadeia por uma fração do custo do Opus, o que é o que o torna sustentável para pesquisa do dia a dia, e não para mergulhos profundos pontuais.

O assistente de suporte ao cliente com um system prompt estável

Históricos longos de conversa, chamadas frequentes de ferramenta no CRM, o mesmo system prompt robusto e schema de ferramentas em cada turno. O cache de prompt do Sonnet transforma esse prefixo fixo em uma fração do custo de entrada após a primeira chamada, o que é o que mantém o custo por conversa estável conforme o volume cresce.

Quando dispensar o Claude Sonnet 4.6

Evite o Sonnet 4.6 nas etapas de raciocínio mais difíceis, em que ele visivelmente perde instruções e você deve escalar para o Opus 4.7; em classificação em massa de alto volume, em que o GPT-5.4 Mini é a opção em massa mais barata e compatível; e em microrrespostas críticas de latência, em que o Kimi K2.7 Code é significativamente mais rápido.

Claude Sonnet 4.6 vs outros modelos

Claude Sonnet 4.6 vs Claude Opus 4.7

O Sonnet 4.6 é ×1; o Opus 4.7 é ×2. O Sonnet dá conta da maioria dos agentes; o Opus é a atualização quando a profundidade de raciocínio importa mais do que a vazão. Muitos times usam o Opus como planejador e o Sonnet como executor.

Claude Sonnet 4.6 vs DeepSeek V4 Pro

O DeepSeek V4 Pro (×0.1) iguala o Sonnet em benchmarks de codificação (SWE-bench Verified reportado pelo fornecedor) a um custo bem menor. O trade-off é alguma confiabilidade no roteamento de ferramentas e um perfil de segurança menos maduro.

Claude Sonnet 4.6 vs GPT-5.4 Mini

O GPT-5.4 Mini é a opção em massa mais barata do lado da OpenAI. Use o Sonnet quando a confiabilidade do roteamento de ferramentas importa mais; use o Mini para pré-filtragem de alto volume e etapas simples que não precisam de roteamento de nível Sonnet.

Conclusão: você deveria usar o Claude Sonnet 4.6?

Comece por aqui. Migre para cima, para o Opus 4.7, ou para baixo, para o Kimi K2.7 Code / DeepSeek V4 Pro, depois de ver o comportamento real em produção e saber qual direção faz sentido.

Perguntas frequentes

Por que o Sonnet 4.6 é o modelo padrão na VM0 Managed?

Ele atinge o melhor equilíbrio entre qualidade de raciocínio, precisão de roteamento de ferramentas e custo na nossa linha. Agentes novos quase sempre funcionam no Sonnet sem mais ajustes.

Qual é a janela de contexto do Claude Sonnet 4.6?

1 milhão de tokens com até 64K tokens de saída por resposta.

O Sonnet 4.6 suporta entrada de imagem?

Sim. Ele é multimodal. Texto, código e imagens.

Quando devo deixar de usar o Sonnet 4.6?

Troque para o Opus 4.7 se o Sonnet visivelmente perder o objetivo em loops longos de agente ou falhar em edições de código difíceis. Troque para o Kimi K2.7 Code ou GPT-5.4 Mini em fluxos simples de alto volume em que o custo é o que mais pesa.

O Sonnet 4.6 é o mesmo que o Sonnet 4.5?

Não. O 4.6 é a geração mais nova da família Claude 4, com melhor comportamento em contexto longo e raciocínio adaptativo. O preço do fornecedor por token é idêntico.

Alternativas

Claude Opus 4.7

Use quando o Sonnet atinge seu teto de raciocínio

DeepSeek V4 Pro

Alternativa bem mais barata com qualidade de raciocínio similar

Usando o Claude Sonnet 4.6 na VM0

Duas formas de acessar o Claude Sonnet 4.6 na VM0

A VM0 suporta o Claude Sonnet 4.6 como um modelo Built-in cobrado em créditos VM0 e via bring-your-own com uma Anthropic API key. O caminho Built-in usa o roteamento Gerenciado da VM0 e o multiplicador de créditos explicado abaixo; o caminho bring-your-own cobra você diretamente com o fornecedor upstream e pula totalmente a conversão de créditos da VM0.

A recomendação da VM0

A VM0 posiciona o Claude Sonnet 4.6 como um modelo de agente central, recomendado ao lado do Claude Opus 4.7, do Claude Opus 4.6 e do Claude Sonnet 4.6 para os passos que determinam o resultado de fato de uma execução de agente. São os modelos que escolheríamos para o papel de orquestrador, para agentes que tocam em código e para qualquer passo em que uma resposta errada sai cara.

Créditos e o multiplicador ×1

Todo modelo Built-in na VM0 é precificado como um múltiplo do Claude Sonnet 4.6, que fica na linha de base de ×1 crédito. O Claude Sonnet 4.6 cobra a ×1 créditos. O multiplicador é o que aparece na sua fatura da VM0; o preço de tabela do fornecedor na tabela de preços acima é o que o provedor upstream cobra antes de a VM0 convertê-lo em créditos.

O Claude Sonnet 4.6 fica na linha de base de ×1 contra a qual todo outro modelo Built-in é precificado, então é a unidade na qual você compara custos ao escolher entre modelos na VM0.

Disponível na VM0 desde Available since launch.