Alle Modelle

MiniMax M3 on VM0. Official MiniMax coding model at ×0.2

Official MiniMax M3 routing for coding agents, 1M context, and native multimodal understanding.

1M tokens · Text / Vision / Code · Prompt cache

MiniMax M3 is MiniMax's frontier coding and agentic model, exposed on VM0 through the official MiniMax Anthropic-compatible endpoint. It is the right MiniMax choice when an agent needs stronger coding, tool use, long-context reasoning, and native vision understanding than the retained M2 series.

VM0 prices M3 from MiniMax's standard non-promotional pay-as-you-go tier for the base context band: $0.60 / $2.40 per 1M tokens, with prompt cache reads at $0.12 / 1M and no separate cache-write billing in the M3 table. MiniMax M2.1 remains available for lower-cost compatibility, while M3 is the default MiniMax BYOK model.

Was ist MiniMax M3?

June 1, 2026 · Official MiniMax M3 text model alongside the retained M2 series.

MiniMax M3 is the new official MiniMax text model for coding and agentic workloads. MiniMax describes it as combining frontier coding capability, a 1M-token context window, and native multimodal understanding.

On VM0, M3 is added to the existing MiniMax API-key provider instead of creating a new integration. It uses the same api.minimax.io/anthropic routing surface and the same MINIMAX_API_KEY secret as M2.

The existing M2 entries stay available, while M3 is the MiniMax provider default for new selections.

Das zeichnet MiniMax M3 aus

Architektur- und Funktionsmerkmale im Überblick.

M3 uses MiniMax Sparse Attention for ultra-long context. The official API supports up to 1M tokens with a 512K guaranteed minimum, automatic prompt cache support, and native multimodal understanding.

Technische Daten auf einen Blick

FamilyMiniMax M3
ModalitiesText, vision, code
LanguagesMultilingual
Context window1M tokens (512K guaranteed minimum)
Prompt cachingSupported with automatic cache reads
Available on VM0June 1, 2026

MiniMax M3 Benchmarks

MiniMax positions M3 around coding, agentic tasks, and long-horizon execution. Treat these as vendor-reported signals and validate against your own VM0 agent regression set.

PostTrainBench Livevendor reported
Rank #3
BrowseCompvendor reported
83.5

MiniMax M3 Preise

Listenpreis des Anbieters, pro 1 Mio. Tokens.

Input$0.60
Output$2.40
Cache Read$0.12
Cache WriteNicht abgerechnet

Wie sich MiniMax M3 in der Praxis verhält

Beobachtetes Verhalten aus produktiven Agent-Durchläufen.

Coding agents

The best MiniMax option for coding assistants, long tool chains, and multi-step repository work.

Long context

A 1M context window lets agents keep large documents, code, logs, and previous work in scope without switching model families.

Multimodal

Native vision understanding makes M3 a better fit than M2 when screenshots, diagrams, or visual artifacts are part of the workflow.

Beste Agent-Aufgaben für MiniMax M3

The coding agent that must stay on MiniMax

Repository edits, debugging, and agentic coding flows where your deployment already uses MiniMax keys but needs a stronger coding model than M2.1.

The long-context review run

Large pull requests, logs, notebooks, or design documents that should stay in one model context while the agent reasons and edits.

The multimodal investigation

Workflows that mix text with screenshots or diagrams. M3 is marked image-input capable on VM0, while the M2 entries stay text/code only.

Wann du MiniMax M3 überspringen solltest

Skip M3 when you need the absolute lowest MiniMax cost and text-only M2.1 is already good enough, or when you need OpenRouter/Vercel routing because this VM0 entry intentionally uses only the official MiniMax path.

MiniMax M3 vs andere Modelle

MiniMax M3 vs Kimi K2.6

Both target coding and agentic work at low cost. Kimi has broader existing gateway support on VM0, while M3 uses the official MiniMax route and gives MiniMax users the newer model.

MiniMax M3 vs Claude Sonnet 4.6

Sonnet 4.6 remains the baseline for reliability on complex English tool-use. M3 is much cheaper and attractive for MiniMax-native coding agents, but should be validated on critical workflows.

Fazit: Solltest du MiniMax M3 nutzen?

Use MiniMax M3 when you want the official MiniMax coding model with long context and vision support. Keep M2.1 when cost and compatibility matter more.

Häufig gestellte Fragen

Is MiniMax M2.1 still available?

Yes. VM0 keeps MiniMax M2.1 in the direct MiniMax provider. M3 is now the default MiniMax BYOK model.

Does VM0 route MiniMax M3 through OpenRouter or Vercel?

No. This entry intentionally uses only the official MiniMax Anthropic-compatible endpoint.

Which M3 pricing tier does VM0 show?

The VM0 model page and usage seed use MiniMax's non-promotional standard base tier. MiniMax also documents a higher standard tier for input above 512K tokens.

Alternativen

MiniMax M3 auf VM0 nutzen

Zwei Wege, um MiniMax M3 auf VM0 zu nutzen

VM0 unterstützt MiniMax M3 als Built-in-Modell, das in VM0-Credits abgerechnet wird, sowie über Bring-your-own mit einem MiniMax API key. Der Built-in-Weg nutzt VM0 Managed Routing und den unten erklärten Credit-Multiplikator; der Bring-your-own-Weg rechnet direkt mit dem Upstream-Anbieter ab und überspringt die VM0-Credit-Umrechnung.

VM0s Empfehlung

VM0 positioniert MiniMax M3 als kostensparende Option statt als Core-Agent-Modell. Nutze es zur Optimierung der Stückkosten bei Nicht-Kernarbeit wie Massenklassifikation, Vorfiltern, latenzkritischen Kurzantworten oder fest zugewiesenen Legacy-Agents, während Claude Opus 4.7, Claude Opus 4.6 oder Claude Sonnet 4.6 die entscheidenden Schritte übernehmen.

Credits und der ×0.2-Multiplikator

Jedes Built-in-Modell auf VM0 wird als Vielfaches von Claude Sonnet 4.6 bepreist, das die ×1-Credit-Basislinie bildet. MiniMax M3 wird mit ×0.2 Credits abgerechnet. Der Multiplikator erscheint auf deiner VM0-Rechnung; der Anbieter-Listenpreis in der obigen Preistabelle ist das, was der Upstream-Anbieter berechnet, bevor VM0 ihn in Credits umrechnet.

MiniMax M3 wird mit ×0.2 abgerechnet, d.h. ein Schritt kostet hier nur das 0.2-fache der Credits eines äquivalenten Schritts mit Sonnet 4.6 (der ×1-Basislinie). Damit liegt es deutlich unter der Credit-Basislinie und ist die natürliche Wahl für volumenstarke Hintergrundarbeit, bei der Kosten pro Schritt wichtiger sind als höchste Reasoning-Qualität.

Verfügbar auf VM0 seit June 1, 2026.