MiniMax M3 na VM0. Modelo oficial de codificação da MiniMax a ×0.2

Roteamento oficial do MiniMax M3 para agentes de codificação, contexto de 1M e compreensão multimodal nativa.

1M tokens · Text / Vision / Code · Prompt cache

O MiniMax M3 é o modelo de fronteira de codificação e agêntico da MiniMax, exposto na VM0 pelo endpoint oficial da MiniMax compatível com a Anthropic. É a escolha certa da MiniMax quando um agente precisa de codificação, uso de ferramentas, raciocínio de contexto longo e compreensão de visão nativa mais fortes do que a série M2 mantida.

A VM0 precifica o M3 a partir do nível pay-as-you-go padrão não promocional da MiniMax para a faixa de contexto base: US$ 0,60 / US$ 2,40 por 1M de tokens, com leituras de cache de prompt a US$ 0,12 / 1M e sem cobrança separada de gravação de cache na tabela do M3. O MiniMax M2.1 permanece disponível para compatibilidade de custo mais baixo, enquanto o M3 é o modelo BYOK padrão da MiniMax.

O que é o MiniMax M3?

1º de junho de 2026 · Modelo de texto oficial MiniMax M3 ao lado da série M2 mantida.

O MiniMax M3 é o novo modelo de texto oficial da MiniMax para cargas de trabalho de codificação e agênticas. A MiniMax o descreve como a combinação de capacidade de codificação de fronteira, uma janela de contexto de 1M de tokens e compreensão multimodal nativa.

Na VM0, o M3 é adicionado ao provedor de chave de API da MiniMax existente em vez de criar uma nova integração. Ele usa a mesma superfície de roteamento api.minimax.io/anthropic e o mesmo segredo MINIMAX_API_KEY do M2.

As entradas existentes do M2 permanecem disponíveis, enquanto o M3 é o padrão do provedor MiniMax para novas seleções.

O que se destaca no MiniMax M3

Principais recursos de arquitetura e capacidade.

O M3 usa MiniMax Sparse Attention para contexto ultralongo. A API oficial oferece suporte a até 1M de tokens com um mínimo garantido de 512K, suporte automático a cache de prompt e compreensão multimodal nativa.

Especificações em resumo

FamíliaMiniMax M3

ModalidadesTexto, visão, código

IdiomasMultilíngue

Janela de contexto1M tokens (mínimo garantido de 512K)

Cache de promptCompatível com leituras de cache automáticas

Disponível na VM01º de junho de 2026

Benchmarks do MiniMax M3

A MiniMax posiciona o M3 em torno de codificação, tarefas agênticas e execução de longo horizonte. Trate-os como sinais reportados pelo fornecedor e valide contra o seu próprio conjunto de regressão de agentes da VM0.

PostTrainBench Livereportado pelo fornecedor

Posição #3

BrowseCompreportado pelo fornecedor

83.5

Preços do MiniMax M3

Preço de tabela do provedor, por 1M de tokens.

Entrada$0.60

Saída$2.40

Leitura de cache$0.12

Escrita de cacheNão cobrado

Como o MiniMax M3 se comporta na prática

Comportamento observado em execuções de agentes em produção.

Agentes de codificação

A melhor opção da MiniMax para assistentes de codificação, longas cadeias de ferramentas e trabalho de repositório de várias etapas.

Contexto longo

Uma janela de contexto de 1M permite que os agentes mantenham grandes documentos, código, logs e trabalho anterior em escopo sem trocar de família de modelos.

Multimodal

A compreensão de visão nativa torna o M3 um encaixe melhor que o M2 quando screenshots, diagramas ou artefatos visuais fazem parte do fluxo de trabalho.

Melhores tarefas de agente para o MiniMax M3

O agente de codificação que precisa permanecer na MiniMax

Edições de repositório, depuração e fluxos de codificação agêntica em que sua implantação já usa chaves da MiniMax, mas precisa de um modelo de codificação mais forte que o M2.1.

A execução de revisão de contexto longo

Grandes pull requests, logs, notebooks ou documentos de design que devem permanecer em um único contexto de modelo enquanto o agente raciocina e edita.

A investigação multimodal

Fluxos que misturam texto com screenshots ou diagramas. O M3 é marcado como capaz de entrada de imagem na VM0, enquanto as entradas do M2 permanecem apenas texto/código.

Quando dispensar o MiniMax M3

Evite o M3 quando você precisa do menor custo absoluto da MiniMax e o M2.1, apenas texto, já é bom o suficiente, ou quando você precisa de roteamento via OpenRouter/Vercel, porque esta entrada da VM0 usa intencionalmente apenas o caminho oficial da MiniMax.

MiniMax M3 vs outros modelos

MiniMax M3 vs Kimi K2.7 Code

Ambos miram trabalho de codificação e agêntico a baixo custo. O Kimi tem suporte de gateway existente mais amplo na VM0, enquanto o M3 usa a rota oficial da MiniMax e entrega aos usuários da MiniMax o modelo mais novo.

MiniMax M3 vs Claude Sonnet 4.6

O Sonnet 4.6 permanece a base de confiabilidade para uso complexo de ferramentas em inglês. O M3 é muito mais barato e atraente para agentes de codificação nativos da MiniMax, mas deve ser validado em fluxos de trabalho críticos.

MiniMax M3 vs GLM-5.2

O GLM-5.2 é a rota padrão atual da Z.AI na VM0. É a melhor comparação para novos agentes baseados na Z.AI, enquanto o GLM-5.1 permanece disponível apenas para compatibilidade com fluxos já ajustados.

Conclusão: você deveria usar o MiniMax M3?

Use o MiniMax M3 quando quiser o modelo oficial de codificação da MiniMax com contexto longo e suporte a visão. Mantenha o M2.1 quando custo e compatibilidade importarem mais.

Perguntas frequentes

O MiniMax M2.1 ainda está disponível?

Sim. A VM0 mantém o MiniMax M2.1 no provedor MiniMax direto. O M3 é agora o modelo BYOK padrão da MiniMax.

A VM0 roteia o MiniMax M3 via OpenRouter ou Vercel?

Não. Esta entrada usa intencionalmente apenas o endpoint oficial da MiniMax compatível com a Anthropic.

Qual nível de preço do M3 a VM0 exibe?

A página de modelo da VM0 e a base de uso usam o nível base padrão não promocional da MiniMax. A MiniMax também documenta um nível padrão mais alto para input acima de 512K tokens.

Alternativas

Kimi K2.7 Code

Modelo de codificação de baixo custo com cobertura de gateway existente mais ampla

Claude Sonnet 4.6

Base de maior confiabilidade para uso complexo de ferramentas

Usando o MiniMax M3 na VM0

Duas formas de acessar o MiniMax M3 na VM0

A VM0 suporta o MiniMax M3 como um modelo Built-in cobrado em créditos VM0 e via bring-your-own com uma MiniMax API key. O caminho Built-in usa o roteamento Gerenciado da VM0 e o multiplicador de créditos explicado abaixo; o caminho bring-your-own cobra você diretamente com o fornecedor upstream e pula totalmente a conversão de créditos da VM0.

A recomendação da VM0

A VM0 posiciona o MiniMax M3 como uma opção de economia de custo, e não como um modelo de agente central. Use-o para otimizar o custo unitário em trabalho não central, como classificação em massa, pré-filtros, respostas curtas críticas em latência ou agentes legados fixados, mantendo o Claude Opus 4.7, o Claude Opus 4.6 ou o Claude Sonnet 4.6 nos passos que decidem a execução.

Créditos e o multiplicador ×0.2

Todo modelo Built-in na VM0 é precificado como um múltiplo do Claude Sonnet 4.6, que fica na linha de base de ×1 crédito. O MiniMax M3 cobra a ×0.2 créditos. O multiplicador é o que aparece na sua fatura da VM0; o preço de tabela do fornecedor na tabela de preços acima é o que o provedor upstream cobra antes de a VM0 convertê-lo em créditos.

O MiniMax M3 cobra a ×0.2, o que significa que um passo aqui custa apenas 0.2× os créditos de um passo equivalente no Sonnet 4.6 (a linha de base de ×1). Isso o coloca bem abaixo da linha de base de créditos e o torna a escolha natural para trabalho de fundo em alto volume, onde o custo por passo importa mais do que a qualidade máxima de raciocínio.

Disponível na VM0 desde June 1, 2026.