GPT-5.4 on VM0. OpenAIのワークホース

OpenAIのGPT-5ファミリーのワークホース。Claude Sonnet 4.6と並んで×1クレジット基準に位置し、ほとんどのCodexフレームワークエージェントに対する正しいデフォルトです。

400K tokens · Text / Vision / Code · Prompt cache

GPT-5.4はOpenAIのGPT-5ファミリーのワークホース — デフォルトでどこでも実行し続けるモデルです。ベンダー報告のSWE-bench Verifiedは74.9%で、コーディングではClaude Sonnet 4.6と同じ範囲に位置し、そのツール使用の正確性は、ほとんどのプロダクションCodexフレームワークエージェントが調整される対象です。

ベンダー定価は$2.5/$15/1Mトークン、キャッシュ入力は$0.25/1M。VM0 Managedでは×1クレジット — Claude Sonnet 4.6と同じ基準 — に位置し、エージェントが既にCodexフレームワーク上にあり、バランスの取れたコスト/品質デフォルトが欲しい場合の自然な選択です。

GPT-5.4とは？

2026年4月 · GPT-5ファミリーのワークホース。ほとんどのCodexフレームワークエージェントに対する推奨デフォルト。

GPT-5.4はOpenAIのGPT-5世代のワークホースで、2026年4月にフラッグシップGPT-5.5とコスト最適化されたGPT-5.4 Miniと一緒にリリースされました。OpenAIは、Codexフレームワーク上のエージェントに対するどこでもデフォルトとして位置付けています — 特定のステップが5.5へのエスカレーションを正当化しない限り、すべてのステップで実行し続けるモデルです。

アーキテクチャ的にGPT-5.4は、GPT-5ファミリーの残りと400Kトークンコンテキストウィンドウ、reasoning_effortパラメーター、プロンプトキャッシュ、Responses APIサーフェスを共有しています。GPT-5.5との分岐は、トークンあたりの計算投資です：5.4はより高速かつ安価に実行され、5.5は推論深度により多く投資します。GPT-5.4 Miniとの分岐はその逆 — 5.4はエージェント実行を実際に決定するステップに対してより多くの品質を運びます。

VM0上では×1クレジット乗数に位置し、Claude Sonnet 4.6と同じ基準なので、AnthropicとOpenAIのデフォルト間の横並びのコスト比較が簡単になります。両者の選択は通常、フレームワーク（Codex対Claude Code）、エコシステム（既存の統合、ツール定義）、およびチームがどちらのモデルにより多くの行動的筋肉記憶を持っているかに帰着します。

GPT-5.4の注目ポイント

アーキテクチャと機能の主な特徴。

GPT-5.4はGPT-5ファミリーの残りと同じアーキテクチャを使用します：400Kトークンコンテキストウィンドウ、4レベル（minimal、low、medium、high）のreasoning_effortパラメーター、キャッシュ入力が入力レートの10分の1で課金されるプロンプトキャッシュ、codex CLIがデフォルトで使用するResponses APIサーフェス。ツール使用、構造化出力、コンピュータ使用がサポートされています。入力はテキスト、ビジョン、コードにわたってマルチモーダル。

スペック概要

ファミリーGPT-5世代

モダリティテキスト、ビジョン、コード

言語英語中心、多言語対応

プロンプトキャッシュサポート（OpenAI）

コンテキストウィンドウ400Kトークン

最大出力最大128Kトークン

推論努力レベルMinimal / Low / Medium / High

ベンダー定価入力$2.5 / 出力$15 /1M

GPT-5.4のベンチマーク

OpenAIのGPT-5リリース資料からのベンダー報告スコア、前世代のOpenAIに対するデルタを示しています。独立レビューはGPT-5.4をClaude Sonnet 4.6と同じコーディング品質帯に位置付けています。絶対パーセンテージは方向性として捉えてください。

SWE-bench Verifiedベンダー報告

74.9%

Terminal-Bench 2.0ベンダー報告のツール使用

~58%

AIME 2025（ツールなし）ベンダー報告の競技数学

~92%

GPQA Diamondベンダー報告の大学院科学

~85%

OSWorld（コンピュータ使用）ベンダー報告

~62%

速度Artificial Analysis、中努力

~110トークン/秒

GPT-5.4の価格

プロバイダー定価、100万トークンあたり。

入力$2.50

出力$15.00

キャッシュ読み取り$0.25

キャッシュ書き込み課金対象外

GPT-5.4の実践的な挙動

本番エージェント実行で観測された動作。

ツールルーティング

標準的なCodexフレームワークのツールカタログ全体で確実な基準精度。5.5が先んじるのは難しいエッジケース（条件付きツール選択、深くネストされた引数）であり、ルーチンケースでは5.4は大幅に低いレイテンシで正しくルーティングします。

コード編集

標準的なリファクタリングとバグ修正ワークロードにおいて、Claude Sonnet 4.6と同等のパッチ品質。5.5が先んじ始めるのは、パッチが初回でクリーンに適用される必要があるマルチファイル変更です。

速度

5.5よりも大幅に高速 — Artificial Analysisによれば中努力で約110トークン/秒。これが、ユーザーに見えるレイテンシが重要なインタラクティブチャット返信と短いエージェントループに対して5.4がデフォルトのままである理由の一部です。

コスト効率

Sonnet 4.6品質帯の出力挙動で×1クレジット。既にCodexフレームワーク上にあるチームにとって、これがコスト/品質のスイートスポット — 目に見えて必要なステップのみ5.5に昇格してください。

ハルシネーション挙動

OpenAIがGPT-5世代で出荷したキャリブレーション改善を継承。特にトレーニング範囲外の質問について、GPT-4シリーズよりも自信のある誤答に陥りにくくなっています。

GPT-5.4に最適なエージェントタスク

Codexフレームワーク上のデフォルトエージェントステップ

エージェントが既にcodex CLIまたは任意のCodexフレームワーク統合上に構築されている場合、GPT-5.4は自然などこでもデフォルトです。×1クレジット、インタラクティブな使用に十分な速度、ほとんどのエージェント実行を支配するルーチンツール呼び出しに十分な正確性。

ビジョン付きインタラクティブチャット

スクリーンショット駆動UI、ドキュメントQ&A、画像アノテーション — GPT-5.4は3つすべてをワークホース速度でマルチモーダルに処理します。×1乗数によりターンあたりのコストがSonnet 4.6と同じ帯に保たれるため、同じワークロードで両者をA/Bテストできます。

Claude Sonnet 4.6に対するコスト/品質A/B

両モデルともVM0 Managedで×1クレジットに位置し、コストで直接比較可能です。同じエージェントを両方で1週間実行し、特定のワークロードでの挙動で選んでください — どちらも普遍的に優れているわけではなく、正しいデフォルトはツールカタログとプロンプトスタイルに依存します。

GPT-5.4を避けるべきケース

5.5が顕著にリードする最も難しい推論、コンピュータ使用、マルチファイルコード編集ステップ、および5.4 Miniがベンダーレベルで4倍安価な大量分類または事前フィルタ作業ではGPT-5.4をスキップしてください。

GPT-5.4 vs 他のモデル

GPT-5.4 vs GPT-5.5

同じファミリー、異なるポジショニング。5.5（×2）は最強の推論、コンピュータ使用、初回コード品質を提供。5.4（×1）は同じコンテキストウィンドウと機能セットを半分のクレジットコストと顕著に高い速度で提供。5.4をデフォルトにし、目に見えて必要なステップのみ5.5にエスカレートしてください。

GPT-5.4 vs Claude Sonnet 4.6

各エコシステムに1つずつの×1基準。Sonnet 4.6はClaude Codeフレームワーク上で実行、GPT-5.4はCodex上で実行。既存のエージェントとツール定義が対象とするフレームワークで選んでください。生の出力品質では両者は十分に近く、ワークロードでA/Bテストすることが正しい判断です。

GPT-5.4 vs GPT-5.4 Mini

同じファミリー、異なるポジショニング。5.4（×1）はトークンあたりにより多くの推論品質を運び、5.4 Mini（×0.3）はバルクと事前フィルタ作業のためのはるかに安価なオプションを提供します。ファンアウト分類には5.4 Mini、エージェント実行を決定するステップには5.4を使用してください。

結論: GPT-5.4を使うべきか？

GPT-5.4はVM0上のCodexフレームワークエージェントに対するどこでもデフォルト。難しい推論には5.5にエスカレート、バルク事前フィルタリングには5.4 Miniに降格してください。

よくある質問

GPT-5.4のコンテキストウィンドウは？

400,000トークン、レスポンスあたり最大128Kトークンの出力。ウィンドウ全体が標準レートで課金されます。

GPT-5.4は画像を処理できますか？

はい。GPT-5.4はマルチモーダルです。テキストとコードと並んで画像入力をネイティブに受け付けます。

GPT-5.4とClaude Sonnet 4.6のどちらを選ぶべき？

エージェントが既にCodexフレームワーク上に構築されている場合、またはOpenAIエコシステム（ツールカタログ、構造化出力、Responses API）が必要な場合。両者とも×1クレジットなのでコストは同一で、選択はフレームワークと挙動の適合性に帰着します。

GPT-5.4はプロンプトキャッシュをサポートしていますか？

はい。キャッシュ入力は$0.25/1Mトークン — キャッシュ部分で10倍の割引。

GPT-5.4はVM0上でどのフレームワークを使用しますか？

Codex。VM0はすべてのGPT-5モデルをCodexフレームワークのResponses APIサーフェス経由でルーティングします。

代替モデル

GPT-5.5

最も難しいステップのためのエスカレーションティア

GPT-5.4 Mini

バルク作業のためのより安価なオプション

Claude Sonnet 4.6

Claude Codeフレームワーク上の×1同等

VM0でGPT-5.4を使う

VM0でGPT-5.4にアクセスする2つの方法

VM0はGPT-5.4を、VM0クレジットで課金されるBuilt-inモデル、およびOpenAI API keyを使用したBring-your-ownの2通りでサポートしています。Built-inパスではVM0 Managedルーティングと後述のクレジット倍率が適用され、Bring-your-ownパスでは上流プロバイダーに直接課金され、VM0クレジットへの変換は行われません。

VM0の推奨

VM0はGPT-5.4をコアエージェントモデルとして位置付けており、Claude Opus 4.7、Claude Opus 4.6、Claude Sonnet 4.6と並んで、エージェント実行の実際の成果を左右するステップに推奨されます。これらは、オーケストレーター役、コードを扱うエージェント、誤った回答のコストが高いステップに選ぶモデルです。

クレジットと×1倍率

VM0のすべてのBuilt-inモデルは、×1クレジット基準となるClaude Sonnet 4.6の倍数で価格設定されています。GPT-5.4は×1クレジットで課金されます。倍率はVM0の請求書に表示されるもので、上記の価格表のベンダー定価はVM0がクレジットに変換する前に上流プロバイダーが請求する金額です。

GPT-5.4は×1基準であり、他のすべてのBuilt-inモデルの価格の基準となるため、VM0でモデルを選択する際のコスト比較の単位となります。

VM0でApril 2026から利用可能。