सभी models

VM0 पर Claude Sonnet 4.6। default agent model

अधिकांश VM0 agents के लिए default। मज़बूत tool routing, अच्छा long-context व्यवहार, और credit baseline। हर दूसरा model Sonnet 4.6 के सापेक्ष कीमत पाता है।

1M tokens · Text / Vision / Code · Prompt cache

Claude Sonnet 4.6, Claude 4 family का workhorse है और VM0 पर default Built-in model है। यह किसी भी सस्ते विकल्प से अधिक भरोसेमंद ढंग से सही arguments के साथ सही tool चुनता है, लाखों-token वार्तालापों में सुसंगत रहता है, और अधिकांश production agents — Slack triage, GitHub PR review, customer support — को इससे आगे promote करने की कभी ज़रूरत नहीं पड़ती।

Vendor list price $3 / $15 प्रति 1M tokens है, जिसमें cached input घटकर $0.30 / 1M हो जाता है। Opus की ओर तभी जाएँ जब Sonnet सबसे कठिन reasoning पर साफ़ तौर पर विफल हो, और Kimi K2.7 Code या GPT-5.4 Mini की ओर तब जब unit cost हावी हो।

Claude Sonnet 4.6 क्या है?

फ़रवरी 2026 (Claude 4.6 generation) · Claude 4 family का mid-tier। Anthropic का workhorse model, cost-saving models और Opus के बीच।

Claude Sonnet 4.6, Anthropic के Claude 4 family के बीच में बैठता है। यह वह workhorse model है जो सामान्य agent काम की पूरी चौड़ाई संभालने के लिए डिज़ाइन किया गया है। Multi-tool routing, code edits, long-running conversations, और structured-output कार्य। Opus के लागत premium के बिना।

VM0 के Built-in lineup में, हर दूसरे model का credit multiplier Sonnet 4.6 (×1) के विरुद्ध सामान्यीकृत है। यही Sonnet को सही विकल्प बनाता है जब आप अनुमान योग्य budget वार्तालाप चाहते हैं: “यह agent मोटे तौर पर एक Sonnet step के 2× पर चलता है” उन absolute डॉलर अनुमानों की तुलना में अधिक उपयोगी वाक्य है जो हर तिमाही बदलते रहते हैं।

Sonnet 4.6, Anthropic के prompt caching का समर्थन करता है, जो उन VM0 agents के लिए बड़ा फ़र्क डालता है जो एक स्थिर system prompt और एक निश्चित tool schema शिप करते हैं। Cached input tokens $3 के बजाय $0.30 प्रति 1M पर बिल होते हैं। prompt के उन हिस्सों पर 10× बचत जो turns के बीच नहीं बदलते।

Claude Sonnet 4.6 में क्या उल्लेखनीय है

मुख्य architecture और capability विशेषताएँ।

Sonnet 4.6 standard pricing पर 1M-token context window, Opus 4.6 से विरासत में मिला adaptive thinking, और prompt caching के साथ शिप होता है जो cached input को input rate के दसवें हिस्से पर बिल करता है। यह text, vision, और code में multimodal input स्वीकार करता है।

एक नज़र में specs

FamilyClaude 4 generation
ModalitiesText, vision, code
LanguagesEnglish-first, multilingual
Prompt cachingसमर्थित (Anthropic)
Context window1M tokens
Max output64K tokens तक
इसके लिए defaultVM0 Managed

Claude Sonnet 4.6 benchmarks

Sonnet 4.6, Anthropic के प्रमुख coding benchmarks पर Opus 4.6 से लगभग 3 से 4 प्रतिशत अंक पीछे बैठता है, जबकि vendor स्तर पर तीन से पाँच गुना सस्ता है। यह सामान्य Opus/Sonnet trade-off है।

SWE-bench Verifiedvendor-reported
~77%
Long-context recallinternal observation
100K+ में मज़बूत
Tool routingVM0 internal
×1 पर सर्वश्रेष्ठ

Claude Sonnet 4.6 pricing

Provider सूची मूल्य, प्रति 1M tokens।

Input$3.00
Output$15.00
Cache read$0.30
Cache write$3.75

Claude Sonnet 4.6 व्यवहार में कैसा प्रदर्शन करता है

Production agent runs से देखा गया व्यवहार।

Tool routing

इस क़ीमत पर सर्वश्रेष्ठ-श्रेणी की tool-routing accuracy। Slack, GitHub, Linear, और Notion में multi-tool flows पर, Sonnet 4.6 ×2 से नीचे के किसी भी model की तुलना में सही arguments के साथ सही tool अधिक भरोसेमंद ढंग से चुनता है।

Long-context coherence

100K+ token transcripts में सुसंगत। केवल सबसे लंबे, सबसे प्रतिकूल runs पर Opus 4.7 से नीचे गिरता है।

Speed

Opus से तेज़ और Kimi K2.7 Code से धीमा। production agents के लिए सही speed/quality संतुलन।

Cost predictability

Pricing credit baseline है; prompt caching निश्चित system prompts वाले agents के लिए on-VM0 लागत को विशेष रूप से अनुमान योग्य बनाता है।

Claude Sonnet 4.6 के लिए सर्वश्रेष्ठ agent tasks

वह Slack agent जो जानता है कि चीज़ें कहाँ हैं

आने वाले सवालों को triage करता है, अटके threads पर follow up करता है, status updates पोस्ट करता है, और search-style queries के जवाब देता है ("auth refactor का मालिक कौन है?")। Sonnet की tool-routing accuracy का मतलब है कि सही tool सही arguments के साथ पहली बार में call होता है, तब भी जब अनुरोध अस्पष्ट हो, इसलिए agent flaky के बजाय भरोसेमंद लगता है।

वह PR review agent जो शोर में नहीं डूबता

Sonnet अधिकांश code-aware काम संभालता है — PR review, test scaffolding, refactor सुझाव, bug bisection — बिना ऐसी stylistic टिप्पणियाँ छोड़े जो किसी ने माँगी ही नहीं। 1M-token context window उसे संबंधित files और पूर्व reviews को तब खींच लाने देता है जब यह मायने रखता है, और आप केवल उन्हीं patches के लिए Opus 4.7 पर escalate करते हैं जिनसे Sonnet साफ़ तौर पर जूझता है।

वह research agent जो लगातार 20 tool calls करता है

GitHub plus Linear plus Notion plus web, बीस-से-अधिक tool turns में एक साथ जुड़कर किसी सवाल का जवाब देने के लिए जैसे "इस ग्राहक ने पिछली तिमाही churn क्यों किया?"। Sonnet पूरी श्रृंखला में लक्ष्य को Opus की लागत के एक अंश पर दृष्टि में रखता है, यही उसे रोज़मर्रा के research के लिए टिकाऊ बनाता है, न कि एक-बार के deep dives के लिए।

स्थिर system prompt वाला customer-support assistant

लंबे वार्तालाप इतिहास, CRM में बार-बार tool calls, हर turn पर वही भारी system prompt और tool schema। Sonnet का prompt caching उस निश्चित prefix को पहली call के बाद input लागत के एक अंश में बदल देता है, यही volume बढ़ने पर per-conversation लागत को सपाट रखता है।

Claude Sonnet 4.6 को कब छोड़ें

Sonnet 4.6 को सबसे कठिन reasoning steps पर छोड़ दें जहाँ यह साफ़ तौर पर निर्देश गिरा देता है और आपको Opus 4.7 पर escalate करना चाहिए, high volume पर bulk classification पर जहाँ GPT-5.4 Mini सस्ता समर्थित bulk विकल्प है, और latency-critical micro-replies पर जहाँ Kimi K2.7 Code काफ़ी तेज़ है।

Claude Sonnet 4.6 बनाम अन्य models

Claude Sonnet 4.6 बनाम Claude Opus 4.7

Sonnet 4.6 ×1 है; Opus 4.7 ×2 है। Sonnet अधिकांश agents संभालता है; Opus तब upgrade है जब reasoning गहराई throughput से अधिक मायने रखती है। कई teams Opus को planner और Sonnet को worker के रूप में उपयोग करती हैं।

Claude Sonnet 4.6 बनाम DeepSeek V4 Pro

DeepSeek V4 Pro (×0.1) coding benchmarks पर Sonnet की बराबरी करता है (vendor-reported SWE-bench Verified) काफ़ी कम लागत पर। trade-off कुछ tool-routing reliability और एक कम-परिपक्व safety profile है।

Claude Sonnet 4.6 बनाम GPT-5.4 Mini

GPT-5.4 Mini, OpenAI की ओर सस्ता bulk विकल्प है। Sonnet का उपयोग तब करें जब tool-routing reliability अधिक मायने रखती हो; Mini का उपयोग high-volume pre-filtering और सरल steps के लिए करें जिन्हें Sonnet-class routing की ज़रूरत नहीं।

निष्कर्ष: क्या आपको Claude Sonnet 4.6 इस्तेमाल करना चाहिए?

यहाँ से शुरू करें। Opus 4.7 की ओर ऊपर या Kimi K2.7 Code / DeepSeek V4 Pro की ओर नीचे तब migrate करें जब आप असली production व्यवहार देख चुके हों और जान चुके हों कि कौन सी दिशा समझ में आती है।

अक्सर पूछे जाने वाले सवाल

VM0 Managed पर Sonnet 4.6 default model क्यों है?

यह हमारे lineup में reasoning quality, tool-routing accuracy, और लागत का सर्वश्रेष्ठ संतुलन छूता है। नए agents लगभग हमेशा बिना अतिरिक्त tuning के Sonnet पर काम करते हैं।

Claude Sonnet 4.6 का context window क्या है?

प्रति response 64K tokens तक output के साथ 1 मिलियन tokens।

क्या Sonnet 4.6 image input का समर्थन करता है?

हाँ। यह multimodal है। Text, code, और images।

मुझे Sonnet 4.6 से कब हटना चाहिए?

Opus 4.7 पर switch करें यदि Sonnet long agent loops पर साफ़ तौर पर लक्ष्य गिरा देता है या कठिन code edits पर विफल होता है। high-volume सरल flows के लिए Kimi K2.7 Code या GPT-5.4 Mini पर switch करें जहाँ लागत हावी होती है।

क्या Sonnet 4.6, Sonnet 4.5 के समान है?

नहीं। 4.6, Claude 4 family में नई generation है जिसमें बेहतर long-context व्यवहार और adaptive thinking है। प्रति token vendor pricing समान है।

विकल्प

VM0 पर Claude Sonnet 4.6 का उपयोग

VM0 पर Claude Sonnet 4.6 तक पहुँचने के दो तरीके

VM0, Claude Sonnet 4.6 को VM0 credits में बिल किए जाने वाले एक Built-in model के रूप में, और Anthropic API key के साथ bring-your-own के ज़रिए समर्थन करता है। Built-in रास्ता VM0 Managed routing और नीचे समझाए गए credit multiplier का उपयोग करता है; bring-your-own रास्ता आपको सीधे upstream vendor के साथ बिल करता है और VM0 credit conversion को पूरी तरह छोड़ देता है।

VM0 की सिफ़ारिश

VM0, Claude Sonnet 4.6 को एक core agent model के रूप में रखता है, जिसकी सिफ़ारिश Claude Opus 4.7, Claude Opus 4.6, और Claude Sonnet 4.6 के साथ उन steps के लिए की जाती है जो किसी agent run के असली परिणाम को संचालित करते हैं। ये वे models हैं जिन्हें हम orchestrator भूमिका के लिए, code-touching agents के लिए, और किसी भी ऐसे step के लिए चुनेंगे जहाँ गलत जवाब महंगा पड़ता है।

Credits और ×1 multiplier

VM0 पर हर Built-in model की कीमत Claude Sonnet 4.6 के एक गुणक के रूप में तय की जाती है, जो ×1 credit baseline पर है। Claude Sonnet 4.6, ×1 credits पर बिल करता है। Multiplier ही वह है जो आपके VM0 invoice पर दिखता है; ऊपर pricing table में vendor सूची मूल्य वह है जो VM0 द्वारा इसे credits में बदलने से पहले upstream provider वसूलता है।

Claude Sonnet 4.6, ×1 baseline पर है जिसके मुकाबले हर दूसरे Built-in model की कीमत तय होती है, इसलिए VM0 पर models के बीच चुनते समय आप इसी इकाई में लागत की तुलना करते हैं।

Available since launch से VM0 पर उपलब्ध।