MiniMax M3 auf VM0. Offizielles MiniMax-Coding-Modell bei ×0,2

Offizielles MiniMax-M3-Routing für Coding-Agenten, 1M Kontext und native multimodale Verarbeitung.

1M tokens · Text / Vision / Code · Prompt cache

MiniMax M3 ist MiniMaxs Frontier-Modell für Coding und agentische Arbeit, auf VM0 über den offiziellen Anthropic-kompatiblen MiniMax-Endpunkt bereitgestellt. Es ist die richtige MiniMax-Wahl, wenn ein Agent stärkeres Coding, Tool-Use, Langkontext-Reasoning und natives Vision-Verständnis braucht als die beibehaltene M2-Serie.

VM0 bepreist M3 anhand von MiniMaxs nicht-promotionaler Standard-Pay-as-you-go-Stufe für das Basiskontextband: $0.60 / $2.40 pro 1M Token, mit Prompt-Cache-Reads bei $0.12 / 1M und ohne separate Cache-Write-Abrechnung in der M3-Tabelle. MiniMax M2.1 bleibt für günstigere Kompatibilität verfügbar, während M3 das Standardmodell für MiniMax BYOK ist.

Was ist MiniMax M3?

1. Juni 2026 · Offizielles MiniMax-M3-Textmodell neben der beibehaltenen M2-Serie.

MiniMax M3 ist das neue offizielle MiniMax-Textmodell für Coding- und Agent-Workloads. MiniMax beschreibt es als Kombination aus Frontier-Coding-Fähigkeit, 1M-Token-Kontextfenster und nativem multimodalem Verständnis.

Auf VM0 wird M3 dem bestehenden MiniMax-API-Key-Provider hinzugefügt, statt eine neue Integration anzulegen. Es nutzt dieselbe Routing-Oberfläche api.minimax.io/anthropic und dasselbe Secret MINIMAX_API_KEY wie M2.

Die bestehenden M2-Einträge bleiben verfügbar, während M3 für neue Auswahlen der Default des MiniMax-Providers ist.

Das zeichnet MiniMax M3 aus

Architektur- und Funktionsmerkmale im Überblick.

M3 nutzt MiniMax Sparse Attention für Ultra-Langkontext. Die offizielle API unterstützt bis zu 1M Token mit 512K garantierter Mindestgröße, automatische Prompt-Cache-Unterstützung und natives multimodales Verständnis.

Technische Daten auf einen Blick

FamilieMiniMax M3

ModalitätenText, Vision, Code

SprachenMehrsprachig

Kontextfenster1M Token (512K garantiertes Minimum)

Prompt cachingUnterstützt mit automatischen Cache-Reads

Verfügbar auf VM01. Juni 2026

MiniMax M3 Benchmarks

MiniMax positioniert M3 für Coding, agentische Aufgaben und Langhorizont-Ausführung. Behandle diese Angaben als Anbieter-Signale und validiere sie gegen dein eigenes VM0-Agent-Regression-Set.

PostTrainBench LiveAnbieterangabe

Rang #3

BrowseCompAnbieterangabe

83.5

MiniMax M3 Preise

Listenpreis des Anbieters, pro 1 Mio. Tokens.

Input$0.60

Output$2.40

Cache Read$0.12

Cache WriteNicht abgerechnet

Wie sich MiniMax M3 in der Praxis verhält

Beobachtetes Verhalten aus produktiven Agent-Durchläufen.

Coding-Agenten

Die beste MiniMax-Option für Coding-Assistenten, lange Tool-Ketten und mehrstufige Repository-Arbeit.

Langkontext

Ein 1M-Kontextfenster hält große Dokumente, Code, Logs und frühere Arbeit im Scope, ohne die Modellfamilie zu wechseln.

Multimodal

Natives Vision-Verständnis macht M3 geeigneter als M2, wenn Screenshots, Diagramme oder visuelle Artefakte Teil des Workflows sind.

Beste Agent-Aufgaben für MiniMax M3

Der Coding-Agent, der bei MiniMax bleiben muss

Repository-Edits, Debugging und agentische Coding-Flows, bei denen dein Deployment bereits MiniMax-Keys nutzt, aber ein stärkeres Coding-Modell als M2.1 braucht.

Der Review-Lauf mit Langkontext

Große Pull Requests, Logs, Notebooks oder Designdokumente, die in einem Modellkontext bleiben sollen, während der Agent denkt und editiert.

Die multimodale Untersuchung

Workflows, die Text mit Screenshots oder Diagrammen mischen. M3 ist auf VM0 als bildeingabefähig markiert, während die M2-Einträge bei Text/Code bleiben.

Wann du MiniMax M3 überspringen solltest

Verzichte auf M3, wenn du die absolut niedrigsten MiniMax-Kosten brauchst und textbasiertes M2.1 bereits genügt, oder wenn du OpenRouter-/Vercel-Routing brauchst, denn dieser VM0-Eintrag nutzt bewusst nur den offiziellen MiniMax-Pfad.

MiniMax M3 vs andere Modelle

MiniMax M3 vs Kimi K2.7 Code

Beide zielen auf günstige Coding- und Agent-Arbeit. Kimi hat breitere bestehende Gateway-Unterstützung auf VM0, während M3 die offizielle MiniMax-Route nutzt und MiniMax-Nutzern das neuere Modell gibt.

MiniMax M3 vs Claude Sonnet 4.6

Sonnet 4.6 bleibt die Basislinie für Zuverlässigkeit bei komplexer englischer Tool-Nutzung. M3 ist deutlich günstiger und attraktiv für MiniMax-native Coding-Agenten, sollte aber für kritische Workflows validiert werden.

MiniMax M3 vs GLM-5.2

GLM-5.2 ist die aktuelle Z.AI-Standardroute auf VM0. Es ist der bessere Vergleich für neue Z.AI-gestützte Agenten; GLM-5.1 bleibt nur für getunte Workflows aus Kompatibilitätsgründen verfügbar.

Fazit: Solltest du MiniMax M3 nutzen?

Nutze MiniMax M3, wenn du das offizielle MiniMax-Coding-Modell mit Langkontext und Vision-Support willst. Behalte M2.1, wenn Kosten und Kompatibilität wichtiger sind.

Häufig gestellte Fragen

Ist MiniMax M2.1 weiterhin verfügbar?

Ja. VM0 behält MiniMax M2.1 im direkten MiniMax-Provider. M3 ist jetzt das Standardmodell für MiniMax BYOK.

Routet VM0 MiniMax M3 über OpenRouter oder Vercel?

Nein. Dieser Eintrag nutzt bewusst nur den offiziellen Anthropic-kompatiblen MiniMax-Endpunkt.

Welche M3-Preisstufe zeigt VM0?

Die VM0-Modellseite und der Usage-Seed nutzen MiniMaxs nicht-promotionale Standard-Basisstufe. MiniMax dokumentiert außerdem eine höhere Standardstufe für Eingaben über 512K Token.

Alternativen

Kimi K2.7 Code

Günstiges Coding-Modell mit breiterer bestehender Gateway-Abdeckung

Claude Sonnet 4.6

Zuverlässigere Basislinie für komplexe Tool-Nutzung

MiniMax M3 auf VM0 nutzen

Zwei Wege, um MiniMax M3 auf VM0 zu nutzen

VM0 unterstützt MiniMax M3 als Built-in-Modell, das in VM0-Credits abgerechnet wird, sowie über Bring-your-own mit einem MiniMax API key. Der Built-in-Weg nutzt VM0 Managed Routing und den unten erklärten Credit-Multiplikator; der Bring-your-own-Weg rechnet direkt mit dem Upstream-Anbieter ab und überspringt die VM0-Credit-Umrechnung.

VM0s Empfehlung

VM0 positioniert MiniMax M3 als kostensparende Option statt als Core-Agent-Modell. Nutze es zur Optimierung der Stückkosten bei Nicht-Kernarbeit wie Massenklassifikation, Vorfiltern, latenzkritischen Kurzantworten oder fest zugewiesenen Legacy-Agents, während Claude Opus 4.7, Claude Opus 4.6 oder Claude Sonnet 4.6 die entscheidenden Schritte übernehmen.

Credits und der ×0.2-Multiplikator

Jedes Built-in-Modell auf VM0 wird als Vielfaches von Claude Sonnet 4.6 bepreist, das die ×1-Credit-Basislinie bildet. MiniMax M3 wird mit ×0.2 Credits abgerechnet. Der Multiplikator erscheint auf deiner VM0-Rechnung; der Anbieter-Listenpreis in der obigen Preistabelle ist das, was der Upstream-Anbieter berechnet, bevor VM0 ihn in Credits umrechnet.

MiniMax M3 wird mit ×0.2 abgerechnet, d.h. ein Schritt kostet hier nur das 0.2-fache der Credits eines äquivalenten Schritts mit Sonnet 4.6 (der ×1-Basislinie). Damit liegt es deutlich unter der Credit-Basislinie und ist die natürliche Wahl für volumenstarke Hintergrundarbeit, bei der Kosten pro Schritt wichtiger sind als höchste Reasoning-Qualität.

Verfügbar auf VM0 seit June 1, 2026.