GPT-5.4 Mini on VM0. コスト削減型GPT-5
OpenAIのGPT-5ファミリーのコスト最適化メンバー。×0.3クレジット、マルチモーダルビジョン、大量のルーティング、分類、事前フィルタ作業に十分な速度。
400K tokens · Text / Vision / Code · Prompt cache
GPT-5.4 MiniはOpenAIのGPT-5ファミリーのコスト削減メンバー — ピーク推論品質よりもユニットコストが重要な場合に手を伸ばすモデルです。ファミリーの残りと同じ400Kコンテキストウィンドウとマルチモーダル入力を維持しますが、トークンあたりの計算を削減しており、それがより低い価格($0.75/$4.5/1M)と顕著に高い速度に翻訳されます。
VM0では×0.3クレジット — Claude Haiku 4.5やKimi K2.6と同じ乗数 — に位置し、バルク分類、ファンアウトルーティング、事前フィルタ、およびGPT-5.4のコストの3分の1に落とすことが決定要因となるエージェントステップに対する自然なOpenAI側の選択です。
GPT-5.4 Miniとは?
2026年4月 · GPT-5ファミリーのコスト削減バリアント。Claude Haiku 4.5のOpenAI側の同等。
GPT-5.4 MiniはOpenAIのGPT-5世代のコスト最適化メンバーで、2026年4月にGPT-5.5とGPT-5.4と一緒にリリースされました。OpenAIは、高スループットティアとして位置付けています — より大きな5.4や5.5がルーチンな決定では無駄になる、分類、ルーティング、事前フィルタステップで実行し続けるモデルです。
アーキテクチャ的にはGPT-5ファミリーの400Kトークンコンテキストウィンドウ、reasoning_effortパラメーター、プロンプトキャッシュ、codex CLIがデフォルトで使用するResponses APIサーフェスを共有しています。5.4とのトレードオフは推論深度です:Miniは標準的なツール呼び出し、短い要約、構造化出力ワークロードを十分に処理しますが、5.4がまだ持ちこたえるより難しいマルチステッププランでドリフトし始めます。同じ価格帯の競合とのトレードオフはエコシステム — 既にCodex上にいる場合、OpenAIサーフェス内に留まることでツール定義と構造化出力スキーマが一貫したまま保たれます。
VM0上ではMiniは×0.3クレジット乗数に位置し、Claude Haiku 4.5、Kimi K2.6、DeepSeek V4 Proと同じです。コスト削減ティア内では、選択は主にフレームワークと特定のワークロードでの挙動の適合性に依存します。
GPT-5.4 Miniの注目ポイント
アーキテクチャと機能の主な特徴。
GPT-5.4 MiniはGPT-5ファミリーの残りと同じアーキテクチャを使用します:400Kトークンコンテキストウィンドウ、4レベルのreasoning_effortパラメーター、キャッシュ入力が入力レートの10分の1で課金されるプロンプトキャッシュ、Responses APIサーフェス。ツール使用、構造化出力、マルチモーダルビジョン入力がサポートされています。モデルはより小さく高速な兄弟 — トークンあたり少ないパラメーター、ドルあたりより多くのスループット。
スペック概要
GPT-5.4 Miniのベンチマーク
OpenAIのGPT-5 Miniリリース資料からのベンダー報告スコア。独立レビューはほとんどのエージェントベンチマークで5.4 MiniをClaude Haiku 4.5と同じコスト削減帯に位置付けています。絶対パーセンテージは方向性として捉えてください。
GPT-5.4 Miniの価格
プロバイダー定価、100万トークンあたり。
GPT-5.4 Miniの実践的な挙動
本番エージェント実行で観測された動作。
速度
GPT-5ファミリーで最速のモデル — Artificial Analysisによれば中努力で約165トークン/秒。これが、ユーザーに見えるレイテンシが支配的なインタラクティブチャット返信と短いファンアウトツール呼び出しに対して実行可能にする性質です。
ルーチンツール呼び出し
標準的なCodexフレームワークのツールカタログで正確。5.4が先んじるのは難しいエッジケース(条件付きツール選択、深くネストされた引数)。ルーチンケースではMiniはコストの3分の1でツールルーティングをクリーンに処理します。
バルク分類と事前フィルタ
GPT-5ファミリーでファンアウト作業に対する最強のコスト/品質ポジション。バルクPRトリアージ、サポートチケット分類、ドキュメントティア分類 — 以前は手書きの正規表現を使っていたすべてのワークロードが、今では実際のモデル呼び出しで手頃な価格になります。
コスト効率
マルチモーダルビジョンを含む×0.3クレジット。この価格帯では、Mini、Claude Haiku 4.5、Kimi K2.6はすべて同じ帯にあり、選択は通常フレームワークの適合性と特定のワークロードでの挙動に帰着します。
エスカレートするタイミング
Miniは長いマルチステッププラン、難しい推論、初回マルチファイルコード編集でドリフトします。Miniがループ全体を運ぼうとするのではなく、オーケストレーターが5.4や5.5にエスカレートするタイミングを決定するようにエージェントを設計してください。
GPT-5.4 Miniに最適なエージェントタスク
すべてのイベントで実行されるファンアウト分類器
受信サポートチケット、PRコメント、セールスコール文字起こし、ドキュメントアップロード — Miniは各々を読み取り、正しいダウンストリームエージェントまたはレビューアにルーティングします。×0.3クレジットと165トークン/秒はイベントあたりのコストを十分に小さくし、サンプルバッチだけでなくすべてのイベントで実行することが実際に実行可能にします。
高価なモデルの前の事前フィルタステップ
Miniをエージェントのツール呼び出しの先頭に固定して、リクエストがエスカレートする必要があるかどうかを決定させます。ほとんどのリクエストは高速で安価な回答を得て、残りの少数のみがフルGPT-5.4または5.5のコストを支払います。これが、コスト削減ティアとコアティアをスタックすることが、実際に手頃な価格を変える場所です。
インタラクティブチャット返信
ユーザーに見えるレイテンシが体験を支配する短いマルチモーダルターン。Miniはストリーミングを瞬時に感じさせるほど高速に答え、マルチモーダルサポートによって会話中のスクリーンショットがそのまま動作します。
GPT-5.4 Miniを避けるべきケース
最も難しい推論、マルチステップエージェントオーケストレーション、コンピュータ使用シーケンス、初回マルチファイルコード編集ではGPT-5.4 Miniをスキップしてください — それらのタスクのルーチンバージョンには5.4にエスカレート、最も難しいものには5.5にエスカレートしてください。
GPT-5.4 Mini vs 他のモデル
GPT-5.4 Mini vs GPT-5.4
同じファミリー、異なるポジショニング。5.4 Mini(×0.3)はコストと速度で勝ち、5.4(×1)は難しいケースでの推論品質とツールルーティング精度で勝ちます。標準パターンはMiniで事前フィルタし、残りのケースを5.4にエスカレートすることです。
GPT-5.4 Mini vs Claude Haiku 4.5
同じ乗数(×0.3)。MiniはCodexフレームワーク上で実行、Haiku 4.5はClaude Code上で実行。両方ともマルチモーダルで、両方とも同じコスト削減スロットを対象としています。既存のエージェントとツール定義が対象とするフレームワークで選んでください。
GPT-5.4 Mini vs DeepSeek V4 Flash
DeepSeek V4 Flash(×0.02)はベンダーレベルで劇的に安価で、純粋なバルク単発作業に対する正しい選択です。GPT-5.4 Mini(×0.3)はより多くの推論品質を運び、OpenAIエコシステム内に留まるため、ツール定義と構造化出力スキーマが既にCodex向けに調整されている場合に重要です。
結論: GPT-5.4 Miniを使うべきか?
GPT-5.4 MiniはOpenAI側のコスト削減デフォルト。Miniで事前フィルタし、ルーチンステップにはGPT-5.4にエスカレート、最も難しい推論にのみGPT-5.5にエスカレートしてください。
よくある質問
GPT-5.4 Miniのコンテキストウィンドウは?
400,000トークン、レスポンスあたり最大128Kトークンの出力 — GPT-5ファミリーの残りと同じ。
GPT-5.4 Miniは画像を処理できますか?
はい。GPT-5ファミリーの残りと同様にテキストとコードと並んで画像入力を受け付けます。
GPT-5.4 MiniとClaude Haiku 4.5のどちらを選ぶべき?
エージェントが既にCodexフレームワーク上に構築されている場合、またはOpenAI構造化出力/ツール呼び出しエコシステムが必要な場合。両者とも×0.3クレジットなのでコストは同一で、選択はフレームワークと挙動に帰着します。
GPT-5.4 Miniはプロンプトキャッシュをサポートしていますか?
はい。キャッシュ入力は$0.075/1Mトークン — キャッシュ部分で10倍の割引。
GPT-5.4 MiniはVM0上でどのフレームワークを使用しますか?
Codex。VM0はすべてのGPT-5モデルをCodexフレームワークのResponses APIサーフェス経由でルーティングします。
代替モデル
VM0でGPT-5.4 Miniを使う
VM0でGPT-5.4 Miniにアクセスする2つの方法
VM0はGPT-5.4 Miniを、VM0クレジットで課金されるBuilt-inモデル、およびOpenAI API keyを使用したBring-your-ownの2通りでサポートしています。Built-inパスではVM0 Managedルーティングと後述のクレジット倍率が適用され、Bring-your-ownパスでは上流プロバイダーに直接課金され、VM0クレジットへの変換は行われません。
VM0の推奨
VM0はGPT-5.4 Miniをコアエージェントモデルではなく、コスト削減オプションとして位置付けています。一括分類、プレフィルター、レイテンシが重要な短い返信、固定のレガシーエージェントなど、非コア作業の単価最適化に使用し、実行を左右するステップにはClaude Opus 4.7、Claude Opus 4.6、またはClaude Sonnet 4.6を維持します。
クレジットと×0.3倍率
VM0のすべてのBuilt-inモデルは、×1クレジット基準となるClaude Sonnet 4.6の倍数で価格設定されています。GPT-5.4 Miniは×0.3クレジットで課金されます。倍率はVM0の請求書に表示されるもので、上記の価格表のベンダー定価はVM0がクレジットに変換する前に上流プロバイダーが請求する金額です。
GPT-5.4 Miniは×0.3で課金されます。つまり、1ステップのコストはSonnet 4.6(×1基準)の同等ステップのわずか0.3倍です。これはクレジット基準を大きく下回り、ピーク時の推論品質よりもステップあたりのコストが重視される高ボリュームのバックグラウンドワークに自然な選択肢です。
VM0でApril 2026から利用可能。