Claude Opus 4.7

O modelo de ponta Claude 4 da Anthropic. A escolha mais forte da família para loops de agentes de longo horizonte, raciocínio difícil e edições de código de primeira tentativa.

1M tokens · Text / Vision / Code · Prompt cache

Usar Claude Opus 4.7 na VM0

O Claude Opus 4.7 é o modelo que você escolhe quando o trabalho precisa estar certo na primeira tentativa: código que compila sem erros, planos de várias etapas que não perdem o fio da meada ao longo de longas cadeias de ferramentas, quebra-cabeças abstratos em que modelos menores tropeçam. Os benchmarks do fornecedor (SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2, OSWorld, BrowseComp) colocam números concretos nos ganhos sobre o Opus 4.6.

O preço de tabela do fornecedor é de $5 / $25 por 1M de tokens, com entrada em cache a $0,50 / 1M, o mais alto da família Claude. O padrão de melhor custo-benefício é manter o Sonnet 4.6 como padrão e rotear apenas as etapas mais difíceis para o Opus.

O que é o Claude Opus 4.7?

Abril de 2026 (sucedendo o Opus 4.6) · Topo de linha da família Claude 4. A atualização recomendada pela Anthropic para usuários do Opus 4.6.

O Claude Opus 4.7 é o modelo de ponta da família Claude 4 da Anthropic, lançado em abril de 2026 como a atualização recomendada a partir do Opus 4.6. A Anthropic o apresenta como uma melhoria radical em programação agêntica e raciocínio abstrato, em vez de uma simples atualização na superfície da API. A janela de contexto de 1M de tokens e os níveis de esforço de raciocínio adaptativo introduzidos no 4.6 são mantidos sem alterações, de modo que o código de agente existente se encaixa sem reescritas.

Em comparação com o Sonnet 4.6 (o cavalo de batalha da mesma família), o Opus investe mais computação por token. O retorno comportamental aparece em três pontos: menos instruções perdidas em loops longos de agentes, patches de código de primeira tentativa materialmente melhores e recuperação mais forte quando o histórico da conversa passa de 100K tokens. A contrapartida é o preço de tabela mais alto da família Claude ($5 / $25 por 1M de tokens) e uma velocidade de saída por token mais lenta, razão pela qual a própria Anthropic posiciona o Opus como a camada de orquestração ou escalação, em vez do padrão para tudo.

Leaderboards independentes (Artificial Analysis, Vellum) corroboram a ordenação relativa em relação ao Opus 4.6, mas os números absolutos mudam semanalmente, e a OpenAI sinalizou contaminação de dados de treinamento no SWE-bench Verified em todos os modelos de ponta. Trate as pontuações públicas como direcionais, em vez de autoritativas; as diferenças comportamentais estruturadas (coerência em loops longos, qualidade de patch de primeira tentativa, confiabilidade de roteamento de múltiplas ferramentas) são o sinal mais duradouro.

O que se destaca no Claude Opus 4.7

Principais recursos de arquitetura e capacidade.

O Opus 4.7 mantém a janela de contexto de 1M de tokens do Opus 4.6, faturada pelo preço de entrada padrão em toda a janela. Ele suporta raciocínio adaptativo em quatro níveis de esforço (low, medium, high e max), uma Compaction API para sumarização de contexto do lado do servidor em execuções longas, e cache de prompt onde a entrada em cache é faturada a um décimo da taxa de entrada. As superfícies de múltiplos agentes e de uso de ferramentas permanecem inalteradas em relação ao 4.6, incluindo o Mailbox Protocol para equipes de agentes ponto a ponto e o parâmetro inference_geo, que expõe inferência apenas nos EUA a um multiplicador de 1,1×. As entradas são multimodais em texto, visão e código.

Especificações em resumo

FamíliaGeração Claude 4

ModalidadesTexto, visão, código

IdiomasInglês em primeiro lugar, multilíngue

Cache de promptSuportado (Anthropic)

Janela de contexto1M de tokens

Saída máximaAté 64K de tokens

Níveis de esforçoLow / Medium / High / Max

Preço de tabela do fornecedor$5 de entrada / $25 de saída por 1M

Benchmarks do Claude Opus 4.7

Pontuações reportadas pelo fornecedor a partir dos materiais de lançamento do Opus 4.7 da Anthropic, com as diferenças mostradas em relação aos números públicos do Opus 4.6. Análises independentes colocam o 4.7 à frente do GPT-5.2 na maioria das tarefas de programação agêntica e a poucos pontos do Gemini 3 Pro em raciocínio abstrato. Trate os percentuais absolutos como direcionais; a OpenAI sinalizou contaminação de dados de treinamento no SWE-bench Verified em todos os modelos de ponta.

SWE-bench Verifiedreportado pelo fornecedor; acima dos 80,8% do Opus 4.6

~83,5%

SWE-bench Proreportado pelo fornecedor

Lidera a família Claude no lançamento

Terminal-Bench 2.0reportado pelo fornecedor; acima dos 65,4% do Opus 4.6

~71%

τ2-bench Retailuso de ferramentas reportado pelo fornecedor

~93%

OSWorld (uso de computador)reportado pelo fornecedor; acima dos 72,7% do Opus 4.6

~76%

BrowseComptarefas web reportadas pelo fornecedor

~88%

ARC AGI 2reportado pelo fornecedor; acima dos 68,8% do Opus 4.6

~75%

Humanity's Last Exam (com ferramentas)reportado pelo fornecedor

Lidera a família Claude

GPQA Diamondciência de nível de pós-graduação reportada pelo fornecedor

~92%

MRCR v2 (1M, 8 agulhas)recuperação de contexto longo

Melhorou em relação aos 76% do 4.6

MMMU Pro (multimodal)reportado pelo fornecedor

Lidera a família Claude

Preços do Claude Opus 4.7

Preço de tabela do provedor, por 1M de tokens.

Entrada$5.00

Saída$25.00

Leitura de cache$0.50

Escrita de cache$6.25

Como o Claude Opus 4.7 se comporta na prática

Comportamento observado em execuções de agentes em produção.

Roteamento de ferramentas

A menor taxa de chamadas de ferramentas mal roteadas da família Claude. A diferença em relação ao Sonnet 4.6 aumenta em casos extremos difíceis, como seleção condicional de ferramentas, argumentos profundamente aninhados e chamadas de ferramentas despachadas após longos trechos de raciocínio.

Recuperação de contexto longo

Coerente em transcrições de agentes com mais de 200K tokens. A janela de 1M de tokens se sustenta muito melhor do que a dos antecessores graças às melhorias de context-rot que a Anthropic introduziu no Opus 4.6 e refinou ainda mais para o 4.7. O MRCR v2 em 1M reportado pelo fornecedor mostra um aumento mensurável em relação aos 76% do Opus 4.6.

Edições de código de primeira tentativa

A mais alta qualidade de patch da família Claude. A escolha certa quando um agente precisa modificar código que deve continuar compilando e passando nos testes, especialmente quando o patch abrange vários arquivos. O resultado do Terminal-Bench 2.0 da Anthropic reflete isso diretamente.

Velocidade

Mais lento do que o Sonnet 4.6 e notavelmente mais lento do que o Kimi K2.7 Code. A Anthropic publica aproximadamente 41 tokens/sec em esforço máximo para o Opus 4.6, e o 4.7 está em uma faixa semelhante. Reserve-o para as etapas que realmente precisam da profundidade extra de raciocínio e execute camadas mais leves em paralelo.

Comportamento de alucinação

O Opus 4.7 mantém a postura conservadora de recusa da Anthropic e tende a admitir incerteza em vez de inventar, que é a razão pela qual as equipes de produção continuam pagando o prêmio por raciocínio de alto risco, apesar de alternativas de pesos abertos mais baratas como o Kimi K2.7 Code e o DeepSeek V4 Pro agora o igualarem em benchmarks.

Melhores tarefas de agente para o Claude Opus 4.7

A revisão de PR que captura o que os humanos deixam passar

Quando um pull request altera 30 arquivos, o Opus 4.7 mantém toda a mudança na memória de trabalho e escreve uma revisão que conecta o que mudou em auth/middleware.ts ao teste que ele quebrou em routes/admin.test.ts. Revisores juniores recebem o tipo de feedback entre arquivos que engenheiros sêniores geralmente captam em uma segunda passagem, e a equipe entrega menos patches que passam no CI, mas quebram em produção.

A pesquisa que lê a pilha inteira

Coloque uma minuta de contrato de 200 páginas, três propostas de concorrentes e os pareceres jurídicos do último trimestre na janela de contexto de 1M de tokens, e então peça ao Opus que sinalize cada cláusula mais rígida do que o mercado e liste os prováveis pontos de negociação. Modelos menores começam a perder seções anteriores após 100K tokens; o Opus mantém o quadro completo em vista e referencia o parágrafo exato que está citando.

O orquestrador executando um plano de múltiplas ferramentas

Use o Opus 4.7 como o planejador que divide a solicitação de um cliente em dez etapas, despacha cada etapa para um subagente Sonnet ou de economia de custo, e costura os resultados de volta. Executar o Opus apenas na camada de planejamento (e as camadas mais baratas em todo o resto) custa uma fração de executar o Opus de ponta a ponta, com a maior parte da qualidade preservada.

As edições de código de primeira tentativa que não desperdiçam uma execução de CI

Peça ao Opus 4.7 que migre uma base de código de 50 arquivos de um ORM para outro, refatore um módulo emaranhado ou aplique uma correção de segurança em todo o repositório. O patch é aplicado sem erros na primeira tentativa com mais frequência do que qualquer outro modelo da família, que é o que o Terminal-Bench 2.0 reportado pelo fornecedor reflete, e o que sua conta de CI também refletirá.

Quando dispensar o Claude Opus 4.7

Evite o Opus 4.7 em trabalho rotineiro de alto volume, onde o Sonnet 4.6 atinge o mesmo nível de qualidade por uma fração do custo, em respostas de chat sensíveis à latência, onde o Kimi K2.7 Code é muito mais rápido, e em tarefas em massa de classificação ou extração, onde o GPT-5.4 Mini é a opção em massa suportada mais barata.

Claude Opus 4.7 vs outros modelos

Claude Opus 4.7 vs Claude Opus 4.8

O Opus 4.8 é o modelo de ponta mais novo com o mesmo multiplicador da VM0. Use o 4.8 para novos agentes de alto risco; mantenha o 4.7 apenas quando um fluxo de trabalho existente tiver sido validado contra ele e a estabilidade importar mais do que os últimos ganhos de benchmark.

Claude Opus 4.7 vs Claude Sonnet 4.6

O Sonnet 4.6 é o padrão de trabalho pesado na família Claude e a escolha certa para a maioria dos agentes. Promova para o Opus 4.7 apenas quando o Sonnet falhar visivelmente em raciocínio difícil, contexto longo ou edições de código de primeira tentativa, geralmente como o orquestrador que delega para baixo a subagentes Sonnet ou de economia de custo.

Claude Opus 4.7 vs Claude Opus 4.6

Mesma janela de contexto (1M de tokens), mesmo preço de fornecedor e a mesma arquitetura de raciocínio adaptativo. O Opus 4.7 é a geração mais nova com ganhos reportados pelo fornecedor no SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2 e OSWorld. Escolha o 4.7 para novos agentes; fixe o 4.6 apenas quando um agente existente tiver sido validado contra essa versão e você precisar de estabilidade de comportamento.

Claude Opus 4.7 vs Kimi K2.7 Code

O Kimi K2.7 Code da Moonshot lidera vários benchmarks agênticos na fronteira de código aberto (SWE-bench Pro 58,6 reportado pelo fornecedor versus 53,4 do Opus 4.6). O Opus 4.7 mantém a liderança em confiabilidade de roteamento de ferramentas para agentes de produção em inglês e em perfil de segurança, razão pela qual a maioria das equipes corporativas ainda o mantém como a camada de alto risco.

Claude Opus 4.7 vs DeepSeek V4 Pro

O DeepSeek V4 Pro fica atrás do Opus na maioria dos benchmarks de raciocínio, mas o iguala em programação (SWE-bench Verified reportado pelo fornecedor dentro de aproximadamente 0,2 ponto). A divisão é simples: escolha o DeepSeek quando o custo bruto dominar, escolha o Opus 4.7 quando a confiabilidade, o perfil de segurança ou a precisão do roteamento de ferramentas importarem mais do que o preço por chamada.

Conclusão: você deveria usar o Claude Opus 4.7?

O Opus 4.7 é a camada de escalação. Use o Sonnet 4.6 como padrão; promova para o Opus apenas nas etapas específicas em que o Sonnet falhar visivelmente.

Perguntas frequentes

Qual é a janela de contexto do Claude Opus 4.7?

1 milhão de tokens, com até 64K tokens de saída por resposta. A janela inteira é faturada pelas taxas padrão. Uma solicitação de 900K tokens tem a mesma taxa por token de uma solicitação de 9K tokens.

O Claude Opus 4.7 consegue lidar com imagens?

Sim. O Opus 4.7 é multimodal. Ele aceita entradas de imagem ao lado de texto e código, então agentes conduzidos por capturas de tela e por visão de documentos funcionam nativamente.

Quando devo escolher o Opus 4.7 em vez do Sonnet 4.6?

Quando (a) o agente é o planejador / orquestrador e as decisões se propagam em cascata, (b) a execução é longa o suficiente para que o Sonnet comece a perder instruções, ou (c) a saída precisa ser aplicada sem erros na primeira tentativa (edições de código, payloads estruturados).

Devo migrar do Opus 4.6 para o Opus 4.7?

Sim. A Anthropic recomenda explicitamente o 4.7 em vez do 4.6. Mesmo multiplicador, comportamento mais forte. Migre agentes de produção fixados apenas após executá-los pela sua suíte de regressão.

O Opus 4.7 suporta cache de prompt?

Sim. A entrada em cache é faturada a $0,50 por 1M de tokens. Um desconto de 10× sobre a parte em cache. Vale a pena usar sempre que seu prompt de sistema ou esquema de ferramentas for estável entre as chamadas.

Alternativas

Claude Opus 4.8

Modelo de ponta mais novo para agentes de alto risco

Claude Sonnet 4.6

Padrão mais barato para a maioria dos loops de agentes

Kimi K2.7 Code

Alternativa de programação de pesos abertos com economia de custo

Usando o Claude Opus 4.7 na VM0

Duas formas de acessar o Claude Opus 4.7 na VM0

A VM0 suporta o Claude Opus 4.7 como um modelo Built-in cobrado em créditos VM0 e via bring-your-own com uma Anthropic API key. O caminho Built-in usa o roteamento Gerenciado da VM0 e o multiplicador de créditos explicado abaixo; o caminho bring-your-own cobra você diretamente com o fornecedor upstream e pula totalmente a conversão de créditos da VM0.

A recomendação da VM0

A VM0 posiciona o Claude Opus 4.7 como um modelo de agente central, recomendado ao lado do Claude Opus 4.7, do Claude Opus 4.6 e do Claude Sonnet 4.6 para os passos que determinam o resultado de fato de uma execução de agente. São os modelos que escolheríamos para o papel de orquestrador, para agentes que tocam em código e para qualquer passo em que uma resposta errada sai cara.

Créditos e o multiplicador ×2

Todo modelo Built-in na VM0 é precificado como um múltiplo do Claude Sonnet 4.6, que fica na linha de base de ×1 crédito. O Claude Opus 4.7 cobra a ×2 créditos. O multiplicador é o que aparece na sua fatura da VM0; o preço de tabela do fornecedor na tabela de preços acima é o que o provedor upstream cobra antes de a VM0 convertê-lo em créditos.

O Claude Opus 4.7 cobra a ×2, o que significa que um passo aqui custa 2× os créditos de um passo equivalente no Sonnet 4.6 (a linha de base de ×1). É um tier premium na VM0, então o padrão custo-efetivo é usar por padrão um modelo mais barato e rotear para o Claude Opus 4.7 apenas os passos que de fato precisam da profundidade extra de raciocínio.

Disponível na VM0 desde April 17, 2026.