MiniMax M3 na VM0. Modelo oficial de codificação da MiniMax a ×0.2
Roteamento oficial do MiniMax M3 para agentes de codificação, contexto de 1M e compreensão multimodal nativa.
1M tokens · Text / Vision / Code · Prompt cache
O MiniMax M3 é o modelo de fronteira de codificação e agêntico da MiniMax, exposto na VM0 pelo endpoint oficial da MiniMax compatível com a Anthropic. É a escolha certa da MiniMax quando um agente precisa de codificação, uso de ferramentas, raciocínio de contexto longo e compreensão de visão nativa mais fortes do que a série M2 mantida.
A VM0 precifica o M3 a partir do nível pay-as-you-go padrão não promocional da MiniMax para a faixa de contexto base: US$ 0,60 / US$ 2,40 por 1M de tokens, com leituras de cache de prompt a US$ 0,12 / 1M e sem cobrança separada de gravação de cache na tabela do M3. O MiniMax M2.1 permanece disponível para compatibilidade de custo mais baixo, enquanto o M3 é o modelo BYOK padrão da MiniMax.
O que é o MiniMax M3?
1º de junho de 2026 · Modelo de texto oficial MiniMax M3 ao lado da série M2 mantida.
O MiniMax M3 é o novo modelo de texto oficial da MiniMax para cargas de trabalho de codificação e agênticas. A MiniMax o descreve como a combinação de capacidade de codificação de fronteira, uma janela de contexto de 1M de tokens e compreensão multimodal nativa.
Na VM0, o M3 é adicionado ao provedor de chave de API da MiniMax existente em vez de criar uma nova integração. Ele usa a mesma superfície de roteamento api.minimax.io/anthropic e o mesmo segredo MINIMAX_API_KEY do M2.
As entradas existentes do M2 permanecem disponíveis, enquanto o M3 é o padrão do provedor MiniMax para novas seleções.
O que se destaca no MiniMax M3
Principais recursos de arquitetura e capacidade.
O M3 usa MiniMax Sparse Attention para contexto ultralongo. A API oficial oferece suporte a até 1M de tokens com um mínimo garantido de 512K, suporte automático a cache de prompt e compreensão multimodal nativa.
Especificações em resumo
Benchmarks do MiniMax M3
A MiniMax posiciona o M3 em torno de codificação, tarefas agênticas e execução de longo horizonte. Trate-os como sinais reportados pelo fornecedor e valide contra o seu próprio conjunto de regressão de agentes da VM0.
Preços do MiniMax M3
Preço de tabela do provedor, por 1M de tokens.
Como o MiniMax M3 se comporta na prática
Comportamento observado em execuções de agentes em produção.
Agentes de codificação
A melhor opção da MiniMax para assistentes de codificação, longas cadeias de ferramentas e trabalho de repositório de várias etapas.
Contexto longo
Uma janela de contexto de 1M permite que os agentes mantenham grandes documentos, código, logs e trabalho anterior em escopo sem trocar de família de modelos.
Multimodal
A compreensão de visão nativa torna o M3 um encaixe melhor que o M2 quando screenshots, diagramas ou artefatos visuais fazem parte do fluxo de trabalho.
Melhores tarefas de agente para o MiniMax M3
O agente de codificação que precisa permanecer na MiniMax
Edições de repositório, depuração e fluxos de codificação agêntica em que sua implantação já usa chaves da MiniMax, mas precisa de um modelo de codificação mais forte que o M2.1.
A execução de revisão de contexto longo
Grandes pull requests, logs, notebooks ou documentos de design que devem permanecer em um único contexto de modelo enquanto o agente raciocina e edita.
A investigação multimodal
Fluxos que misturam texto com screenshots ou diagramas. O M3 é marcado como capaz de entrada de imagem na VM0, enquanto as entradas do M2 permanecem apenas texto/código.
Quando dispensar o MiniMax M3
Evite o M3 quando você precisa do menor custo absoluto da MiniMax e o M2.1, apenas texto, já é bom o suficiente, ou quando você precisa de roteamento via OpenRouter/Vercel, porque esta entrada da VM0 usa intencionalmente apenas o caminho oficial da MiniMax.
MiniMax M3 vs outros modelos
MiniMax M3 vs Kimi K2.7 Code
Ambos miram trabalho de codificação e agêntico a baixo custo. O Kimi tem suporte de gateway existente mais amplo na VM0, enquanto o M3 usa a rota oficial da MiniMax e entrega aos usuários da MiniMax o modelo mais novo.
MiniMax M3 vs Claude Sonnet 4.6
O Sonnet 4.6 permanece a base de confiabilidade para uso complexo de ferramentas em inglês. O M3 é muito mais barato e atraente para agentes de codificação nativos da MiniMax, mas deve ser validado em fluxos de trabalho críticos.
MiniMax M3 vs GLM-5.2
O GLM-5.2 é a rota padrão atual da Z.AI na VM0. É a melhor comparação para novos agentes baseados na Z.AI, enquanto o GLM-5.1 permanece disponível apenas para compatibilidade com fluxos já ajustados.
Conclusão: você deveria usar o MiniMax M3?
Use o MiniMax M3 quando quiser o modelo oficial de codificação da MiniMax com contexto longo e suporte a visão. Mantenha o M2.1 quando custo e compatibilidade importarem mais.
Perguntas frequentes
O MiniMax M2.1 ainda está disponível?
Sim. A VM0 mantém o MiniMax M2.1 no provedor MiniMax direto. O M3 é agora o modelo BYOK padrão da MiniMax.
A VM0 roteia o MiniMax M3 via OpenRouter ou Vercel?
Não. Esta entrada usa intencionalmente apenas o endpoint oficial da MiniMax compatível com a Anthropic.
Qual nível de preço do M3 a VM0 exibe?
A página de modelo da VM0 e a base de uso usam o nível base padrão não promocional da MiniMax. A MiniMax também documenta um nível padrão mais alto para input acima de 512K tokens.
Alternativas
Usando o MiniMax M3 na VM0
Duas formas de acessar o MiniMax M3 na VM0
A VM0 suporta o MiniMax M3 como um modelo Built-in cobrado em créditos VM0 e via bring-your-own com uma MiniMax API key. O caminho Built-in usa o roteamento Gerenciado da VM0 e o multiplicador de créditos explicado abaixo; o caminho bring-your-own cobra você diretamente com o fornecedor upstream e pula totalmente a conversão de créditos da VM0.
A recomendação da VM0
A VM0 posiciona o MiniMax M3 como uma opção de economia de custo, e não como um modelo de agente central. Use-o para otimizar o custo unitário em trabalho não central, como classificação em massa, pré-filtros, respostas curtas críticas em latência ou agentes legados fixados, mantendo o Claude Opus 4.7, o Claude Opus 4.6 ou o Claude Sonnet 4.6 nos passos que decidem a execução.
Créditos e o multiplicador ×0.2
Todo modelo Built-in na VM0 é precificado como um múltiplo do Claude Sonnet 4.6, que fica na linha de base de ×1 crédito. O MiniMax M3 cobra a ×0.2 créditos. O multiplicador é o que aparece na sua fatura da VM0; o preço de tabela do fornecedor na tabela de preços acima é o que o provedor upstream cobra antes de a VM0 convertê-lo em créditos.
O MiniMax M3 cobra a ×0.2, o que significa que um passo aqui custa apenas 0.2× os créditos de um passo equivalente no Sonnet 4.6 (a linha de base de ×1). Isso o coloca bem abaixo da linha de base de créditos e o torna a escolha natural para trabalho de fundo em alto volume, onde o custo por passo importa mais do que a qualidade máxima de raciocínio.
Disponível na VM0 desde June 1, 2026.