Todos os modelos

DeepSeek V4 Pro na VM0. Raciocínio com custo otimizado

O modelo de raciocínio V4 carro-chefe da DeepSeek. A 0,2 ponto do Claude Opus 4.6 no SWE-bench Verified por um sétimo do custo do fornecedor. API compatível com Claude.

1M tokens · Text / Code · Prompt cache

O DeepSeek V4 Pro é o carro-chefe da geração V4 da DeepSeek — um MoE open-weight de 1.6T de parâmetros sob a licença MIT. O destaque é a relação preço/qualidade: o SWE-bench Verified reportado pelo fornecedor é de 80,6%, a uma fração de ponto do Claude Opus 4.6, por cerca de um sétimo do custo do fornecedor da Anthropic. Isso torna agentes pesados em raciocínio — revisão de PRs em volume, análise de documentos em lote, sumarização agendada — acessíveis em alto volume.

O preço de tabela do fornecedor é de US$ 1,74 / US$ 3,48 por 1M de tokens, com leituras de cache a US$ 0,028 / 1M e gravações de cache gratuitas (algo único na linha). Contexto de 1M de tokens, API compatível com a Anthropic. Recorra ao Sonnet 4.6 quando a confiabilidade do roteamento de ferramentas em produção for o fator decisivo, e ao GPT-5.4 Mini ou ao Kimi K2.7 Code quando o trabalho em volume de uma só passada não precisar da profundidade de raciocínio do V4 Pro.

O que é o DeepSeek V4 Pro?

24 de abril de 2026 · Variante de raciocínio da família DeepSeek V4, focada em máxima qualidade de raciocínio.

O DeepSeek V4 Pro é o carro-chefe da geração V4 da DeepSeek, lançado em 24 de abril de 2026 sob a licença MIT. É um modelo Mixture-of-Experts open-weight com 1.6T de parâmetros totais e 49B ativos por token.

O V4 Pro oferece suporte a uma janela de contexto de 1M de tokens, saída máxima de 384K, três modos de esforço de raciocínio (standard, think, think-max), saída JSON, chamadas de ferramenta e completação FIM no modo non-think. O modelo Pro adiciona uma arquitetura de atenção híbrida (Compressed Sparse Attention + Heavily Compressed Attention) para uma eficiência de contexto longo drasticamente melhorada. 27% dos FLOPs de inferência de um único token e 10% do cache KV em relação ao DeepSeek V3.2 a 1M de contexto.

A DeepSeek fez barulho ao longo de 2025 ao entregar raciocínio de nível Anthropic por uma fração do preço. O V4 Pro mantém esse padrão: o SWE-bench Verified de 80,6% reportado pelo fornecedor fica a 0,2 ponto do Claude Opus 4.6, por cerca de um sétimo do custo do fornecedor. Na VM0 ele é exposto pelo provedor de chave de API da DeepSeek e no VM0 Managed a ×0.1. Multiplicador mais baixo que o do Kimi K2.7 Code, com comportamento de raciocínio substancialmente mais forte.

O que se destaca no DeepSeek V4 Pro

Principais recursos de arquitetura e capacidade.

O V4 Pro é um modelo Mixture-of-Experts com 1.6T de parâmetros totais e 49B ativos por token, com uma pilha de atenção híbrida (Compressed Sparse Attention mais Heavily Compressed Attention) que mantém a inferência de contexto longo barata. Oferece suporte a uma janela de contexto de 1M de tokens com 384K de saída máxima, três modos de esforço de raciocínio (standard, think e think-max), e usa Manifold-Constrained Hyper-Connections para propagação estável de sinal. O modelo foi treinado em mais de 32T de tokens com o otimizador Muon e é distribuído sob a licença MIT com open weights.

Especificações em resumo

FamíliaSérie DeepSeek V4
Parâmetros1.6T totais / 49B ativos (MoE)
ModalidadesTexto, código
IdiomasMultilíngue
Janela de contexto1M tokens
Saída máxima384K tokens
LicençaMIT (open weights)
Disponível na VM024 de abril de 2026

Benchmarks do DeepSeek V4 Pro

Pontuações reportadas pelo fornecedor a partir do lançamento do V4 Pro da DeepSeek. Análises independentes (Geeky Gadgets, Code Arena) colocam o V4 Pro em terceiro no Code Arena, atrás do GLM-5.1 e do Kimi K2.7 Code. As afirmações de benchmark mais fortes vêm dos próprios materiais da DeepSeek. Trate como orientação direcional, não como verdade absoluta.

SWE-bench Verifiedreportado pelo fornecedor; a 0,2 pt do Opus 4.6
80.6%
Terminal-Bench 2.0reportado pelo fornecedor; lidera sobre o Opus 4.6
67.9%
LiveCodeBenchreportado pelo fornecedor
93.5%
Rating Codeforcesreportado pelo fornecedor
3206
MMLU-Proreportado pelo fornecedor
Empata com o GPT-5.4
Artificial Analysis Intelligence Indexesforço máximo
52
VelocidadeArtificial Analysis
~36 tokens/s

Preços do DeepSeek V4 Pro

Preço de tabela do provedor, por 1M de tokens.

Entrada$1.74
Saída$3.48
Leitura de cache$0.14
Escrita de cacheNão cobrado

Como o DeepSeek V4 Pro se comporta na prática

Comportamento observado em execuções de agentes em produção.

Raciocínio

O raciocínio sub-Sonnet mais forte da nossa linha. Se sustenta em trabalho de várias etapas onde modelos mais baratos começam a se desviar. O MMLU-Pro reportado pelo fornecedor empata com o GPT-5.4.

Benchmarks de codificação

SWE-bench Verified 80,6% reportado pelo fornecedor (a 0,2 do Opus 4.6), Terminal-Bench 2.0 67,9% (lidera sobre o Opus 4.6), LiveCodeBench 93,5%.

Eficiência de custo

A propriedade de destaque. O custo de ×0.1 em créditos com raciocínio que compete bem com o Sonnet 4.6 torna o V4 Pro o padrão de otimização de custo, muito mais barato que o Claude Opus 4.7.

Economia de cache

As gravações de cache são gratuitas. Algo único entre os modelos Built-in da VM0. Prompts de sistema estáveis e grandes documentos de referência colados não custam nada extra para serem armazenados em cache; só o lado da leitura é cobrado.

Velocidade

Cerca de 36 tokens/s no esforço máximo, segundo a Artificial Analysis. Mais lento que o Kimi K2.7 Code, ligeiramente mais lento que o Opus 4.6.

Melhores tarefas de agente para o DeepSeek V4 Pro

O agente de revisão de PR que roda a cada commit

Precisão de nível Sonnet por uma fração do custo do fornecedor do Sonnet é o que torna "revisar cada commit, não só os PRs grandes" realmente viável. O V4 Pro lê o diff, os arquivos relacionados e a issue vinculada, depois escreve um comentário estruturado — e o preço por chamada é baixo o suficiente para que rodá-lo como uma etapa de CI a cada push não apareça como um item de despesa perceptível.

O sumarizador agendado que roda toda noite

Puxa as conversas de clientes, os tickets de suporte ou as chamadas de vendas do dia anterior e escreve um resumo. O prompt de sistema e o esquema de ferramentas não mudam entre execuções, e a DeepSeek não cobra gravações de cache — então o longo prefixo fixo é pago uma vez e as leituras em cache custam uma fração do input normal. É aqui que o modelo de preços do V4 Pro realmente muda o que é acessível.

O agente de código do repositório inteiro que custa menos que o Opus

Contexto de 1M de tokens com atenção híbrida (Compressed Sparse Attention mais Heavily Compressed Attention) significa que uma base de código de tamanho médio cabe em um único prompt e o custo de inferência permanece gerenciável à medida que a janela se enche. Para refatorações entre arquivos e revisões em nível de arquitetura, é aqui que você obtém o fluxo "ver tudo de uma vez" no estilo do Opus sem a fatura no estilo do Opus.

Quando dispensar o DeepSeek V4 Pro

Evite o V4 Pro nos casos de borda mais difíceis de roteamento de ferramentas, onde o Sonnet 4.6 ainda lidera, e em trabalho em volume de uma só passada onde o GPT-5.4 Mini ou o Kimi K2.7 Code são suficientes a um custo menor.

DeepSeek V4 Pro vs outros modelos

DeepSeek V4 Pro vs Claude Sonnet 4.6

O Sonnet 4.6 (×1) vence nos casos de borda de roteamento de ferramentas e no raciocínio em inglês. O V4 Pro (×0.1) vence em custo e é competitivo em benchmarks de codificação (reportados pelo fornecedor). Vale fazer testes A/B em um agente real antes de se comprometer.

DeepSeek V4 Pro vs Kimi K2.7 Code

Multiplicador mais baixo que o do Kimi (×0.1 contra ×0.3). O Kimi tem recall de contexto longo mais forte e um Intelligence Index mais alto (54 contra 52); o V4 Pro tem a melhor economia de cache (gravações gratuitas) e uma janela de contexto de 1M contra os 256K do Kimi. Escolha pela propriedade que importa mais.

DeepSeek V4 Pro vs GLM-5.2

O GLM-5.2 é a rota padrão atual da Z.AI na VM0. É a melhor comparação para novos agentes baseados na Z.AI, enquanto o GLM-5.1 permanece disponível apenas para compatibilidade com fluxos já ajustados.

Conclusão: você deveria usar o DeepSeek V4 Pro?

Pré-filtre com o GPT-5.4 Mini ou o Kimi K2.7 Code, escale para o V4 Pro para raciocínio, e escale para o Sonnet 4.6 só quando o V4 Pro travar em casos de borda de roteamento de ferramentas.

Perguntas frequentes

Quando o DeepSeek V4 Pro foi lançado?

A DeepSeek lançou o V4 Pro em 24 de abril de 2026 sob a licença MIT com open weights.

Por que as gravações de cache são gratuitas?

A DeepSeek não cobra a parte de gravação de cache. Só as leituras de cache são cobradas, a US$ 0,145 por 1M de tokens. Prompts de sistema estáveis e grandes contextos de referência não custam nada extra para serem armazenados em cache.

Qual é a janela de contexto do V4 Pro?

1 milhão de tokens com até 384K tokens de saída. A arquitetura de atenção híbrida torna a janela inteira utilizável a um custo de inferência muito menor que o do V3.2.

Como o V4 Pro se compara ao Claude Opus 4.6?

O SWE-bench Verified reportado pelo fornecedor fica a 0,2 ponto (80,6 contra 80,8). O Terminal-Bench 2.0 favorece o V4 Pro (67,9 contra 65,4). O Opus 4.6 lidera no HLE (40,0 contra 37,7) e na matemática HMMT 2026 (96,2 contra 95,2). A um custo de fornecedor cerca de 7× menor, o V4 Pro é a escolha certa quando a qualidade do raciocínio é o critério, mas o custo importa.

O V4 Pro é open-source?

Sim. Os pesos são publicados sob a licença MIT. A API hospedada da DeepSeek é o caminho de produção para a VM0.

Alternativas

Usando o DeepSeek V4 Pro na VM0

Duas formas de acessar o DeepSeek V4 Pro na VM0

A VM0 suporta o DeepSeek V4 Pro como um modelo Built-in cobrado em créditos VM0 e via bring-your-own com uma DeepSeek API key. O caminho Built-in usa o roteamento Gerenciado da VM0 e o multiplicador de créditos explicado abaixo; o caminho bring-your-own cobra você diretamente com o fornecedor upstream e pula totalmente a conversão de créditos da VM0.

A recomendação da VM0

A VM0 posiciona o DeepSeek V4 Pro como uma opção de economia de custo, e não como um modelo de agente central. Use-o para otimizar o custo unitário em trabalho não central, como classificação em massa, pré-filtros, respostas curtas críticas em latência ou agentes legados fixados, mantendo o Claude Opus 4.7, o Claude Opus 4.6 ou o Claude Sonnet 4.6 nos passos que decidem a execução.

Créditos e o multiplicador ×0.1

Todo modelo Built-in na VM0 é precificado como um múltiplo do Claude Sonnet 4.6, que fica na linha de base de ×1 crédito. O DeepSeek V4 Pro cobra a ×0.1 créditos. O multiplicador é o que aparece na sua fatura da VM0; o preço de tabela do fornecedor na tabela de preços acima é o que o provedor upstream cobra antes de a VM0 convertê-lo em créditos.

O DeepSeek V4 Pro cobra a ×0.1, o que significa que um passo aqui custa apenas 0.1× os créditos de um passo equivalente no Sonnet 4.6 (a linha de base de ×1). Isso o coloca bem abaixo da linha de base de créditos e o torna a escolha natural para trabalho de fundo em alto volume, onde o custo por passo importa mais do que a qualidade máxima de raciocínio.

Disponível na VM0 desde April 24, 2026.