VM0 पर GPT-5.4। OpenAI workhorse

GPT-5 family का OpenAI workhorse। Claude Sonnet 4.6 के साथ ×1 credit baseline पर बैठता है और अधिकांश Codex-framework agents के लिए सही default है।

400K tokens · Text / Vision / Code · Prompt cache

VM0 पर GPT-5.4 इस्तेमाल करें

GPT-5.4, OpenAI के GPT-5 family का workhorse है — वह model जिसे आप default रूप से सर्वत्र चलाते रहते हैं। 74.9% पर vendor-reported SWE-bench Verified इसे coding पर Claude Sonnet 4.6 की उसी श्रेणी में रखता है, और इसकी tool-use accuracy वही है जिसके विरुद्ध अधिकांश production Codex-framework agents tuned होते हैं।

Vendor list price $2.5 / $15 प्रति 1M tokens है, जिसमें cached input $0.25 / 1M पर है। यह VM0 Managed पर ×1 credits पर बैठता है — Claude Sonnet 4.6 जैसा ही baseline — जो इसे स्वाभाविक विकल्प बनाता है जब आपका agent पहले से Codex framework पर है और आप एक संतुलित cost/quality default चाहते हैं।

GPT-5.4 क्या है?

अप्रैल 2026 · GPT-5 family का workhorse। अधिकांश Codex-framework agents के लिए अनुशंसित default।

GPT-5.4, OpenAI की GPT-5 generation का workhorse है, जिसे अप्रैल 2026 में फ्लैगशिप GPT-5.5 और cost-optimised GPT-5.4 Mini के साथ रिलीज़ किया गया। OpenAI इसे Codex framework पर agents के लिए सर्वत्र-default के रूप में स्थापित करता है — वह model जिसे आप हर step पर चलाते रहते हैं जब तक कोई खास step 5.5 पर escalation को सही न ठहराए।

Architectural रूप से GPT-5.4, बाक़ी GPT-5 family के साथ 400K-token context window, reasoning_effort parameter, prompt caching और Responses API surface साझा करता है। GPT-5.5 के विरुद्ध विभाजन प्रति token compute निवेश का है: 5.4 तेज़ और सस्ता चलता है, 5.5 reasoning गहराई में अधिक निवेश करता है। GPT-5.4 Mini के विरुद्ध विभाजन उल्टा है — 5.4 उन steps के लिए अधिक quality वहन करता है जो वास्तव में agent run तय करते हैं।

VM0 पर यह ×1 credit multiplier पर बैठता है, Claude Sonnet 4.6 जैसा ही baseline, जो Anthropic और OpenAI defaults के बीच side-by-side लागत तुलनाओं को सहज बना देता है। दोनों के बीच चुनाव आमतौर पर framework (Codex बनाम Claude Code), ecosystem (मौजूदा integrations, tool definitions) और इस पर निर्भर करता है कि आपकी team के पास किस model की अधिक व्यवहारिक muscle memory है।

GPT-5.4 में क्या उल्लेखनीय है

मुख्य architecture और capability विशेषताएँ।

GPT-5.4, बाक़ी GPT-5 family जैसी ही architecture का उपयोग करता है: 400K-token context window, चार levels (minimal, low, medium, high) पर reasoning_effort parameter, prompt caching जहाँ cached input input rate के दसवें हिस्से पर बिल होता है, और Responses API surface जिसका codex CLI default रूप से उपयोग करता है। Tool-use, structured outputs और computer-use समर्थित हैं। Inputs text, vision और code में multimodal हैं।

एक नज़र में specs

FamilyGPT-5 generation

ModalitiesText, vision, code

LanguagesEnglish-first, multilingual

Prompt cachingसमर्थित (OpenAI)

Context window400K tokens

Max output128K tokens तक

Reasoning effortMinimal / Low / Medium / High

Vendor list price$2.5 input / $15 output प्रति 1M

GPT-5.4 benchmarks

OpenAI की GPT-5 release सामग्री से vendor-reported scores, पिछली OpenAI generation के विरुद्ध deltas के साथ दिखाए गए। स्वतंत्र समीक्षाएँ GPT-5.4 को Claude Sonnet 4.6 की उसी coding-quality band में रखती हैं। Absolute प्रतिशतों को दिशासूचक मानें।

SWE-bench Verifiedvendor-reported

74.9%

Terminal-Bench 2.0vendor-reported tool use

~58%

AIME 2025 (no tools)vendor-reported competition math

~92%

GPQA Diamondvendor-reported graduate science

~85%

OSWorld (computer use)vendor-reported

~62%

SpeedArtificial Analysis, medium effort

~110 tokens/sec

GPT-5.4 pricing

Provider सूची मूल्य, प्रति 1M tokens।

Input$2.50

Output$15.00

Cache read$0.25

Cache writeबिल नहीं किया गया

GPT-5.4 व्यवहार में कैसा प्रदर्शन करता है

Production agent runs से देखा गया व्यवहार।

Tool routing

मानक Codex-framework tool catalogue में ठोस baseline accuracy। जहाँ 5.5 आगे निकलता है वह कठिन edge cases (conditional tool selection, deeply nested arguments) पर है — नियमित मामलों के लिए 5.4 काफ़ी कम latency के साथ सही route करता है।

Code edits

मानक refactor और bug-fix workloads पर Claude Sonnet 4.6 के तुलनीय patch quality। जहाँ 5.5 आगे निकलना शुरू करता है वह multi-file changes पर है जहाँ patch को पहली बार में साफ़-सुथरा लागू होना है।

Speed

5.5 से काफ़ी तेज़ — Artificial Analysis के अनुसार medium effort पर लगभग 110 tokens/sec। यह एक कारण है कि 5.4, interactive chat replies और short agent loops के लिए default बना रहता है जहाँ user-visible latency मायने रखती है।

Cost efficiency

Sonnet 4.6 quality band में output व्यवहार के साथ ×1 credits। पहले से Codex framework पर मौजूद teams के लिए, यह cost/quality का sweet spot है — केवल उन्हीं steps पर 5.5 पर promote करें जिन्हें इसकी साफ़ ज़रूरत हो।

Hallucination behaviour

OpenAI द्वारा GPT-5 generation के साथ शिप किए गए calibration सुधारों को विरासत में लेता है। GPT-4 series की तुलना में आत्मविश्वास से गलत उत्तर देने की कम प्रवृत्ति, खासकर अपने training horizon के बाहर के सवालों पर।

GPT-5.4 के लिए सर्वश्रेष्ठ agent tasks

Codex framework पर default agent step

यदि आपका agent पहले से codex CLI या किसी Codex-framework integration पर बना है, तो GPT-5.4 स्वाभाविक सर्वत्र-default है। ×1 credits, interactive उपयोग के लिए पर्याप्त तेज़, उन नियमित tool calls के लिए पर्याप्त सटीक जो अधिकांश agent runs पर हावी रहते हैं।

vision के साथ interactive chat

Screenshot-driven UIs, document Q&A, image annotation — GPT-5.4 तीनों को multimodally workhorse speed पर संभालता है। ×1 multiplier per-turn लागत को Sonnet 4.6 की उसी band में रखता है, इसलिए आप एक ही workload पर दोनों को एक-दूसरे के विरुद्ध A/B कर सकते हैं।

Claude Sonnet 4.6 के विरुद्ध cost/quality A/B

दोनों models VM0 Managed पर ×1 credits पर बैठते हैं, जो उन्हें लागत पर सीधे तुलनीय बनाता है। एक सप्ताह तक एक ही agent दोनों पर चलाएँ और अपने खास workload पर व्यवहार के आधार पर चुनें — कोई भी सार्वभौमिक रूप से बेहतर नहीं है, और सही default आपके tool catalogue और prompt शैली पर निर्भर करता है।

GPT-5.4 को कब छोड़ें

GPT-5.4 को सबसे कठिन reasoning, computer-use या multi-file code-edit steps पर छोड़ दें जहाँ 5.5 उल्लेखनीय रूप से अग्रणी है, और high-volume bulk classification या pre-filter काम पर जहाँ 5.4 Mini vendor स्तर पर चार गुना सस्ता है।

GPT-5.4 बनाम अन्य models

GPT-5.4 बनाम GPT-5.5

वही family, अलग positioning। 5.5 (×2) आपको सबसे मज़बूत reasoning, computer-use और first-attempt code quality देता है; 5.4 (×1) आपको वही context window और feature set आधी credit लागत और उल्लेखनीय रूप से अधिक speed पर देता है। default रूप से 5.4 का उपयोग करें; केवल उन्हीं steps पर 5.5 पर escalate करें जिन्हें इसकी साफ़ ज़रूरत हो।

GPT-5.4 बनाम Claude Sonnet 4.6

दो ×1 baselines, हर ecosystem में एक। Sonnet 4.6, Claude Code framework पर चलता है; GPT-5.4, Codex पर चलता है। इस आधार पर चुनें कि आपके मौजूदा agents और tool definitions किस framework को लक्षित करते हैं। raw output quality पर वे इतने क़रीब हैं कि अपने workload पर A/B-testing करना सही रास्ता है।

GPT-5.4 बनाम GPT-5.4 Mini

वही family, अलग positioning। 5.4 (×1) प्रति token अधिक reasoning quality वहन करता है; 5.4 Mini (×0.3) आपको bulk और pre-filter काम के लिए काफ़ी सस्ता विकल्प देता है। fan-out classification के लिए 5.4 Mini का उपयोग करें और agent run तय करने वाले steps के लिए 5.4 का।

निष्कर्ष: क्या आपको GPT-5.4 इस्तेमाल करना चाहिए?

GPT-5.4, VM0 पर Codex-framework agents के लिए सर्वत्र-default है। कठिन reasoning के लिए 5.5 पर escalate करें, bulk pre-filtering के लिए 5.4 Mini पर गिरें।

अक्सर पूछे जाने वाले सवाल

GPT-5.4 का context window क्या है?

400,000 tokens, प्रति response 128K tokens तक output के साथ। पूरा window standard rates पर बिल होता है।

क्या GPT-5.4 images संभाल सकता है?

हाँ। GPT-5.4 multimodal है। यह text और code के साथ image inputs natively स्वीकार करता है।

मुझे Claude Sonnet 4.6 के बजाय GPT-5.4 कब चुनना चाहिए?

जब आपका agent पहले से Codex framework पर बना हो या आपको OpenAI ecosystem (tool catalogue, structured outputs, Responses API) चाहिए। दोनों ×1 credits पर बैठते हैं, इसलिए लागत समान है और चुनाव framework तथा behaviour fit पर आ जाता है।

क्या GPT-5.4 prompt caching का समर्थन करता है?

हाँ। Cached input $0.25 प्रति 1M tokens पर बिल होता है — cached हिस्से पर 10× छूट।

VM0 पर GPT-5.4 कौन सा framework उपयोग करता है?

Codex। VM0 सभी GPT-5 models को Codex framework के Responses API surface के ज़रिए route करता है।

विकल्प

GPT-5.5

सबसे कठिन steps के लिए escalation tier

GPT-5.4 Mini

bulk काम के लिए सस्ता विकल्प

Claude Sonnet 4.6

Claude Code framework पर ×1 समकक्ष

VM0 पर GPT-5.4 का उपयोग

VM0 पर GPT-5.4 तक पहुँचने के दो तरीके

VM0, GPT-5.4 को VM0 credits में बिल किए जाने वाले एक Built-in model के रूप में, और OpenAI API key के साथ bring-your-own के ज़रिए समर्थन करता है। Built-in रास्ता VM0 Managed routing और नीचे समझाए गए credit multiplier का उपयोग करता है; bring-your-own रास्ता आपको सीधे upstream vendor के साथ बिल करता है और VM0 credit conversion को पूरी तरह छोड़ देता है।

VM0 की सिफ़ारिश

VM0, GPT-5.4 को एक core agent model के रूप में रखता है, जिसकी सिफ़ारिश Claude Opus 4.7, Claude Opus 4.6, और Claude Sonnet 4.6 के साथ उन steps के लिए की जाती है जो किसी agent run के असली परिणाम को संचालित करते हैं। ये वे models हैं जिन्हें हम orchestrator भूमिका के लिए, code-touching agents के लिए, और किसी भी ऐसे step के लिए चुनेंगे जहाँ गलत जवाब महंगा पड़ता है।

Credits और ×1 multiplier

VM0 पर हर Built-in model की कीमत Claude Sonnet 4.6 के एक गुणक के रूप में तय की जाती है, जो ×1 credit baseline पर है। GPT-5.4, ×1 credits पर बिल करता है। Multiplier ही वह है जो आपके VM0 invoice पर दिखता है; ऊपर pricing table में vendor सूची मूल्य वह है जो VM0 द्वारा इसे credits में बदलने से पहले upstream provider वसूलता है।

GPT-5.4, ×1 baseline पर है जिसके मुकाबले हर दूसरे Built-in model की कीमत तय होती है, इसलिए VM0 पर models के बीच चुनते समय आप इसी इकाई में लागत की तुलना करते हैं।

April 2026 से VM0 पर उपलब्ध।