GPT-5.4 Mini on VM0. コスト削減型GPT-5

OpenAIのGPT-5ファミリーのコスト最適化メンバー。×0.3クレジット、マルチモーダルビジョン、大量のルーティング、分類、事前フィルタ作業に十分な速度。

400K tokens · Text / Vision / Code · Prompt cache

GPT-5.4 MiniはOpenAIのGPT-5ファミリーのコスト削減メンバー — ピーク推論品質よりもユニットコストが重要な場合に手を伸ばすモデルです。ファミリーの残りと同じ400Kコンテキストウィンドウとマルチモーダル入力を維持しますが、トークンあたりの計算を削減しており、それがより低い価格（$0.75/$4.5/1M）と顕著に高い速度に翻訳されます。

VM0では×0.3クレジット — Kimi K2.7 Codeと同じ乗数 — に位置し、バルク分類、ファンアウトルーティング、事前フィルタ、およびGPT-5.4のコストの3分の1に落とすことが決定要因となるエージェントステップに対する自然なOpenAI側の選択です。

GPT-5.4 Miniとは？

2026年4月 · GPT-5ファミリーのコスト削減バリアント。Kimi K2.7 CodeのOpenAI側の同等。

GPT-5.4 MiniはOpenAIのGPT-5世代のコスト最適化メンバーで、2026年4月にGPT-5.5とGPT-5.4と一緒にリリースされました。OpenAIは、高スループットティアとして位置付けています — より大きな5.4や5.5がルーチンな決定では無駄になる、分類、ルーティング、事前フィルタステップで実行し続けるモデルです。

アーキテクチャ的にはGPT-5ファミリーの400Kトークンコンテキストウィンドウ、reasoning_effortパラメーター、プロンプトキャッシュ、codex CLIがデフォルトで使用するResponses APIサーフェスを共有しています。5.4とのトレードオフは推論深度です：Miniは標準的なツール呼び出し、短い要約、構造化出力ワークロードを十分に処理しますが、5.4がまだ持ちこたえるより難しいマルチステッププランでドリフトし始めます。同じ価格帯の競合とのトレードオフはエコシステム — 既にCodex上にいる場合、OpenAIサーフェス内に留まることでツール定義と構造化出力スキーマが一貫したまま保たれます。

VM0上ではMiniは×0.3クレジット乗数に位置し、Kimi K2.7 Codeと同じです。DeepSeek V4 Proはより低い×0.1です。コスト削減ティア内では、選択は主にフレームワークと特定のワークロードでの挙動の適合性に依存します。

GPT-5.4 Miniの注目ポイント

アーキテクチャと機能の主な特徴。

GPT-5.4 MiniはGPT-5ファミリーの残りと同じアーキテクチャを使用します：400Kトークンコンテキストウィンドウ、4レベルのreasoning_effortパラメーター、キャッシュ入力が入力レートの10分の1で課金されるプロンプトキャッシュ、Responses APIサーフェス。ツール使用、構造化出力、マルチモーダルビジョン入力がサポートされています。モデルはより小さく高速な兄弟 — トークンあたり少ないパラメーター、ドルあたりより多くのスループット。

スペック概要

ファミリーGPT-5世代

モダリティテキスト、ビジョン、コード

言語英語中心、多言語対応

プロンプトキャッシュサポート（OpenAI）

コンテキストウィンドウ400Kトークン

最大出力最大128Kトークン

推論努力レベルMinimal / Low / Medium / High

ベンダー定価入力$0.75 / 出力$4.5 /1M

GPT-5.4 Miniのベンチマーク

OpenAIのGPT-5 Miniリリース資料からのベンダー報告スコア。独立レビューはほとんどのエージェントベンチマークで5.4 MiniをKimi K2.7 Codeと同じコスト削減帯に位置付けています。絶対パーセンテージは方向性として捉えてください。

SWE-bench Verifiedベンダー報告

~60%

Terminal-Bench 2.0ベンダー報告のツール使用

~42%

AIME 2025（ツールなし）ベンダー報告の競技数学

~84%

GPQA Diamondベンダー報告の大学院科学

~74%

速度Artificial Analysis、中努力

~165トークン/秒

GPT-5.4 Miniの価格

プロバイダー定価、100万トークンあたり。

入力$0.75

出力$4.50

キャッシュ読み取り$0.07

キャッシュ書き込み課金対象外

GPT-5.4 Miniの実践的な挙動

本番エージェント実行で観測された動作。

速度

GPT-5ファミリーで最速のモデル — Artificial Analysisによれば中努力で約165トークン/秒。これが、ユーザーに見えるレイテンシが支配的なインタラクティブチャット返信と短いファンアウトツール呼び出しに対して実行可能にする性質です。

ルーチンツール呼び出し

標準的なCodexフレームワークのツールカタログで正確。5.4が先んじるのは難しいエッジケース（条件付きツール選択、深くネストされた引数）。ルーチンケースではMiniはコストの3分の1でツールルーティングをクリーンに処理します。

バルク分類と事前フィルタ

GPT-5ファミリーでファンアウト作業に対する最強のコスト/品質ポジション。バルクPRトリアージ、サポートチケット分類、ドキュメントティア分類 — 以前は手書きの正規表現を使っていたすべてのワークロードが、今では実際のモデル呼び出しで手頃な価格になります。

コスト効率

マルチモーダルビジョンを含む×0.3クレジット。MiniとKimi K2.7 Codeは同じ帯にあり、DeepSeek V4 Proはより低い×0.1です — 選択は通常フレームワークの適合性と特定のワークロードでの挙動に帰着します。

エスカレートするタイミング

Miniは長いマルチステッププラン、難しい推論、初回マルチファイルコード編集でドリフトします。Miniがループ全体を運ぼうとするのではなく、オーケストレーターが5.4や5.5にエスカレートするタイミングを決定するようにエージェントを設計してください。

GPT-5.4 Miniに最適なエージェントタスク

すべてのイベントで実行されるファンアウト分類器

受信サポートチケット、PRコメント、セールスコール文字起こし、ドキュメントアップロード — Miniは各々を読み取り、正しいダウンストリームエージェントまたはレビューアにルーティングします。×0.3クレジットと165トークン/秒はイベントあたりのコストを十分に小さくし、サンプルバッチだけでなくすべてのイベントで実行することが実際に実行可能にします。

高価なモデルの前の事前フィルタステップ

Miniをエージェントのツール呼び出しの先頭に固定して、リクエストがエスカレートする必要があるかどうかを決定させます。ほとんどのリクエストは高速で安価な回答を得て、残りの少数のみがフルGPT-5.4または5.5のコストを支払います。これが、コスト削減ティアとコアティアをスタックすることが、実際に手頃な価格を変える場所です。

インタラクティブチャット返信

ユーザーに見えるレイテンシが体験を支配する短いマルチモーダルターン。Miniはストリーミングを瞬時に感じさせるほど高速に答え、マルチモーダルサポートによって会話中のスクリーンショットがそのまま動作します。

GPT-5.4 Miniを避けるべきケース

最も難しい推論、マルチステップエージェントオーケストレーション、コンピュータ使用シーケンス、初回マルチファイルコード編集ではGPT-5.4 Miniをスキップしてください — それらのタスクのルーチンバージョンには5.4にエスカレート、最も難しいものには5.5にエスカレートしてください。

GPT-5.4 Mini vs 他のモデル

GPT-5.4 Mini vs GPT-5.4

同じファミリー、異なるポジショニング。5.4 Mini（×0.3）はコストと速度で勝ち、5.4（×1）は難しいケースでの推論品質とツールルーティング精度で勝ちます。標準パターンはMiniで事前フィルタし、残りのケースを5.4にエスカレートすることです。

GPT-5.4 Mini vs Claude Sonnet 4.6

ツールルーティング品質が純粋なスループットより重要な場合、Claude Sonnet 4.6の方が信頼できる比較対象です。Miniは事前フィルタリングや簡単なステップでより安価かつ高速です。

GPT-5.4 Mini vs DeepSeek V4 Pro

DeepSeek V4 ProはVM0クレジットが低く、コスト優先の推論ではより強い選択肢です。価格と推論の深さが支配的ならDeepSeek、OpenAIフレームワークとの相性と高スループットが重要ならMiniを使います。

結論: GPT-5.4 Miniを使うべきか？

GPT-5.4 MiniはOpenAI側のコスト削減デフォルト。Miniで事前フィルタし、ルーチンステップにはGPT-5.4にエスカレート、最も難しい推論にのみGPT-5.5にエスカレートしてください。

よくある質問

GPT-5.4 Miniのコンテキストウィンドウは？

400,000トークン、レスポンスあたり最大128Kトークンの出力 — GPT-5ファミリーの残りと同じ。

GPT-5.4 Miniは画像を処理できますか？

はい。GPT-5ファミリーの残りと同様にテキストとコードと並んで画像入力を受け付けます。

GPT-5.4 MiniとKimi K2.7 Codeのどちらを選ぶべき？

エージェントが既にCodexフレームワーク上に構築されている場合、またはOpenAI構造化出力/ツール呼び出しエコシステムが必要な場合。両者とも×0.3クレジットなのでコストは同一で、選択はフレームワークと挙動に帰着します。

GPT-5.4 Miniはプロンプトキャッシュをサポートしていますか？

はい。キャッシュ入力は$0.075/1Mトークン — キャッシュ部分で10倍の割引。

GPT-5.4 MiniはVM0上でどのフレームワークを使用しますか？

Codex。VM0はすべてのGPT-5モデルをCodexフレームワークのResponses APIサーフェス経由でルーティングします。

代替モデル

GPT-5.4

より難しいステップへのステップアップ、同じファミリー

VM0でGPT-5.4 Miniを使う

VM0でGPT-5.4 Miniにアクセスする2つの方法

VM0はGPT-5.4 Miniを、VM0クレジットで課金されるBuilt-inモデル、およびOpenAI API keyを使用したBring-your-ownの2通りでサポートしています。Built-inパスではVM0 Managedルーティングと後述のクレジット倍率が適用され、Bring-your-ownパスでは上流プロバイダーに直接課金され、VM0クレジットへの変換は行われません。

VM0の推奨

VM0はGPT-5.4 Miniをコアエージェントモデルではなく、コスト削減オプションとして位置付けています。一括分類、プレフィルター、レイテンシが重要な短い返信、固定のレガシーエージェントなど、非コア作業の単価最適化に使用し、実行を左右するステップにはClaude Opus 4.7、Claude Opus 4.6、またはClaude Sonnet 4.6を維持します。

クレジットと×0.3倍率

VM0のすべてのBuilt-inモデルは、×1クレジット基準となるClaude Sonnet 4.6の倍数で価格設定されています。GPT-5.4 Miniは×0.3クレジットで課金されます。倍率はVM0の請求書に表示されるもので、上記の価格表のベンダー定価はVM0がクレジットに変換する前に上流プロバイダーが請求する金額です。

GPT-5.4 Miniは×0.3で課金されます。つまり、1ステップのコストはSonnet 4.6（×1基準）の同等ステップのわずか0.3倍です。これはクレジット基準を大きく下回り、ピーク時の推論品質よりもステップあたりのコストが重視される高ボリュームのバックグラウンドワークに自然な選択肢です。

VM0でApril 2026から利用可能。