Claude Opus 4.6 na VM0

O antigo carro-chefe da Anthropic. Mesmo multiplicador e contexto de 1M do Opus 4.7. Mantenha-o fixado apenas quando um agente já tiver sido validado nesta versão exata.

1M tokens · Text / Vision / Code · Prompt cache

Usar Claude Opus 4.6 na VM0

O Claude Opus 4.6 foi o carro-chefe da Anthropic antes do Opus 4.7 e introduziu boa parte do que hoje define a família Claude 4: a janela de contexto de 1M tokens em beta, o raciocínio adaptativo em quatro níveis de esforço e as maiores pontuações de codificação agêntica que a Anthropic havia lançado até então (SWE-bench Verified 80,8%, Terminal-Bench 2.0 65,4%, OSWorld 72,7%, todos reportados pelo fornecedor).

O preço de tabela do fornecedor é o mesmo $5 / $25 por 1M tokens do 4.7. O único bom motivo para permanecer no 4.6 é a estabilidade de comportamento de um agente que já foi validado nesta versão; qualquer coisa nova deve começar no 4.7.

O que é o Claude Opus 4.6?

5 de fevereiro de 2026 · Antigo topo de linha da família Claude 4. Substituído pelo Claude Opus 4.7.

O Claude Opus 4.6 era o modelo de fronteira da Anthropic antes do Opus 4.7. Foi lançado em 5 de fevereiro de 2026 e introduziu diversos recursos que definiram a família Claude 4. Raciocínio adaptativo com quatro níveis de esforço, a janela de contexto de 1M tokens em beta e as maiores pontuações de codificação agêntica da Anthropic no lançamento.

Na VM0, ele fica no mesmo multiplicador de ×2 créditos do Opus 4.7. A Anthropic recomenda explicitamente migrar para o 4.7 em trabalhos novos; fixe o 4.6 apenas se um agente específico já tiver sido validado nesta versão e você ainda não quiser refazer os testes de regressão.

O que se destaca no Claude Opus 4.6

Principais recursos de arquitetura e capacidade.

O Opus 4.6 introduziu o raciocínio adaptativo com quatro níveis de esforço (low, medium, high e max, com high como padrão) e a janela de contexto de 1M tokens em beta com preço padrão. Ele adicionou uma Compaction API para resumir o contexto no lado do servidor, desativou o prefilling como mudança incompatível em relação ao Opus 4.5 (use structured outputs no lugar) e trouxe um Mailbox Protocol para times multiagentes ponto a ponto. Um parâmetro inference_geo expõe inferência exclusiva nos EUA com um multiplicador de 1,1×.

Especificações em resumo

FamíliaGeração Claude 4

ModalidadesTexto, visão, código

IdiomasFoco em inglês, multilíngue

Cache de promptCompatível (Anthropic)

Janela de contexto1M tokens (beta)

Saída máximaAté 128K tokens

Disponível na VM0Disponível desde o lançamento

Benchmarks do Claude Opus 4.6

Pontuações reportadas pelo fornecedor, vindas dos materiais de lançamento do Opus 4.6 da Anthropic e da Artificial Analysis. Trate os números absolutos do SWE-bench com cautela. A OpenAI sinalizou contaminação de dados de treinamento no SWE-bench Verified em todos os modelos de fronteira.

SWE-bench Verifiedreportado pelo fornecedor

80.8%

Terminal-Bench 2.0reportado pelo fornecedor

65.4%

OSWorld (uso de computador)reportado pelo fornecedor

72.7%

MRCR v2 (1M, 8-needle)reportado pelo fornecedor

76%

Artificial Analysis Intelligence Indexesforço máximo

VelocidadeArtificial Analysis

~41 tokens/sec

Preços do Claude Opus 4.6

Preço de tabela do provedor, por 1M de tokens.

Entrada$15.00

Saída$75.00

Leitura de cache$1.50

Escrita de cache$18.75

Como o Claude Opus 4.6 se comporta na prática

Comportamento observado em execuções de agentes em produção.

Raciocínio

Forte em etapas de raciocínio difíceis. O Opus 4.7 é incrementalmente melhor a um custo de fornecedor um pouco menor. Não há nenhuma categoria de benchmark em que o 4.6 lidere.

Uso de ferramentas

Confiável em fluxos de agente com múltiplas ferramentas. Na mesma faixa do Sonnet 4.6 em precisão de roteamento, com robustez extra em casos extremos.

Contexto longo

Contexto de 1M tokens com 76% de recall no MRCR v2. Realmente utilizável em toda a janela, não só no nominal.

Velocidade

Mais lento que o Sonnet 4.6 e o Kimi K2.7 Code; comparável ao Opus 4.7. Cerca de 41 tokens/sec em esforço máximo, segundo a Artificial Analysis.

Melhores tarefas de agente para o Claude Opus 4.6

O agente em produção que já se paga

Sua equipe passou duas semanas ajustando prompts e schemas de ferramentas no Opus 4.6, o agente está no ar há um mês e os clientes estão satisfeitos. Fixar no 4.6 mantém o comportamento idêntico enquanto você decide se a atualização para o 4.7 vale um ciclo de revalidação, em vez de deixar a Anthropic atualizar seu tráfego automaticamente e mudar as saídas em silêncio por baixo dos panos.

A baseline de regressão para um rollout do Opus 4.7

Rode o mesmo conjunto de prompts no 4.6 e no 4.7 lado a lado, compare as saídas e decida onde a atualização realmente muda o comportamento antes de ligar a chave em produção. Mesmo preço de fornecedor, mesmo multiplicador, interface idêntica — a única coisa diferente são os pesos do modelo, que é exatamente o que você quer ao isolar regressões.

Quando dispensar o Claude Opus 4.6

Não comece agentes novos no Opus 4.6 a menos que tenha um motivo concreto, já que o 4.7 chega com o mesmo multiplicador, comportamento mais forte e um preço de tabela do fornecedor mais baixo. Qualquer coisa sensível a custo deve ir para o 4.7 pelo mesmo motivo.

Claude Opus 4.6 vs outros modelos

Claude Opus 4.6 vs Claude Opus 4.7

Mesmo multiplicador de ×2 e janela de contexto de 1M. O Opus 4.7 é mais novo, mais rápido e tem preço de tabela do fornecedor mais baixo. Fixe o 4.6 apenas quando você já tiver investido em ajustes nesta versão.

Claude Opus 4.6 vs Claude Sonnet 4.6

O Sonnet 4.6 é ×1 e dá conta da maioria dos loops de agente. Recorra ao Opus apenas quando o Sonnet falhar visivelmente. Normalmente em orquestração ou edições de código difíceis.

Claude Opus 4.6 vs Kimi K2.7 Code

O Kimi K2.7 Code (×0.3) supera por pouco o Opus 4.6 no SWE-bench Pro (58,6 vs 53,4 reportados pelo fornecedor) e é bem mais barato. O Opus 4.6 mantém a vantagem no perfil de segurança e é a escolha padrão para empresas do Ocidente.

Conclusão: você deveria usar o Claude Opus 4.6?

Fixe se você já validou nele; caso contrário, comece no Opus 4.7. A migração é uma mudança de configuração, não uma reescrita.

Perguntas frequentes

Quando o Claude Opus 4.6 foi lançado?

A Anthropic lançou o Opus 4.6 em 5 de fevereiro de 2026. O Opus 4.7 veio logo em seguida.

Devo migrar do Opus 4.6 para o Opus 4.7?

Sim, para trabalhos novos. Mesmo multiplicador, mesmo contexto de 1M, preço de tabela do fornecedor mais baixo e comportamento mais forte em tarefas de codificação agêntica. Migre agentes fixados apenas depois de passá-los pela sua suíte de regressão.

Qual é a janela de contexto do Claude Opus 4.6?

1 milhão de tokens (beta) com até 128K tokens de saída por resposta.

Por que o Opus 4.6 é o padrão no provedor de chave de API da Anthropic?

É o padrão histórico de antes do lançamento do Opus 4.7. Você pode trocar qualquer agente para Opus 4.7, Sonnet 4.6 ou Kimi K2.7 Code em VM0 Settings → Model Providers sem mudar a chave de API.

O que é o raciocínio adaptativo?

Uma camada de agendamento que permite ao Claude decidir quanto poder de raciocínio gastar por turno. Quatro níveis. Low, medium, high, max. Com high como padrão. Substituiu o botão de pensamento estendido do Opus 4.5.

Alternativas

Claude Opus 4.7

Mais novo, custo de fornecedor menor

Claude Sonnet 4.6

Baseline Sonnet a um custo bem menor

Kimi K2.7 Code

Alternativa open-weight mais barata em benchmarks agênticos

Usando o Claude Opus 4.6 na VM0

Duas formas de acessar o Claude Opus 4.6 na VM0

A VM0 suporta o Claude Opus 4.6 como um modelo Built-in cobrado em créditos VM0 e via bring-your-own com uma Anthropic API key. O caminho Built-in usa o roteamento Gerenciado da VM0 e o multiplicador de créditos explicado abaixo; o caminho bring-your-own cobra você diretamente com o fornecedor upstream e pula totalmente a conversão de créditos da VM0.

A recomendação da VM0

A VM0 posiciona o Claude Opus 4.6 como um modelo de agente central, recomendado ao lado do Claude Opus 4.7, do Claude Opus 4.6 e do Claude Sonnet 4.6 para os passos que determinam o resultado de fato de uma execução de agente. São os modelos que escolheríamos para o papel de orquestrador, para agentes que tocam em código e para qualquer passo em que uma resposta errada sai cara.

Créditos e o multiplicador ×2

Todo modelo Built-in na VM0 é precificado como um múltiplo do Claude Sonnet 4.6, que fica na linha de base de ×1 crédito. O Claude Opus 4.6 cobra a ×2 créditos. O multiplicador é o que aparece na sua fatura da VM0; o preço de tabela do fornecedor na tabela de preços acima é o que o provedor upstream cobra antes de a VM0 convertê-lo em créditos.

O Claude Opus 4.6 cobra a ×2, o que significa que um passo aqui custa 2× os créditos de um passo equivalente no Sonnet 4.6 (a linha de base de ×1). É um tier premium na VM0, então o padrão custo-efetivo é usar por padrão um modelo mais barato e rotear para o Claude Opus 4.6 apenas os passos que de fato precisam da profundidade extra de raciocínio.

Disponível na VM0 desde Available since launch.