Claude Sonnet 4.6 di VM0. Model agen default

Default untuk sebagian besar agen VM0. Tool routing yang kuat, perilaku konteks panjang yang baik, dan baseline kredit. Setiap model lain dihargai relatif terhadap Sonnet 4.6.

1M tokens · Text / Vision / Code · Prompt cache

Gunakan Claude Sonnet 4.6 di VM0

Claude Sonnet 4.6 adalah kuda beban keluarga Claude 4 dan model Built-in default di VM0. Model ini memilih tool yang tepat dengan argumen yang tepat lebih andal daripada apa pun yang lebih murah, tetap koheren di percakapan ratusan ribu token, dan sebagian besar agen produksi — triase Slack, ulasan PR GitHub, dukungan pelanggan — tidak pernah perlu dinaikkan melampauinya.

Harga daftar vendor adalah $3 / $15 per 1M token, dengan input yang di-cache turun ke $0,30 / 1M. Gunakan Opus hanya ketika Sonnet jelas-jelas gagal pada penalaran tersulit, dan Kimi K2.7 Code atau GPT-5.4 Mini ketika biaya per unit menjadi penentu.

Apa itu Claude Sonnet 4.6?

Februari 2026 (generasi Claude 4.6) · Tingkat menengah keluarga Claude 4. Model kuda beban Anthropic, berada di antara model penghemat biaya dan Opus.

Claude Sonnet 4.6 berada di tengah keluarga Claude 4 Anthropic. Ini adalah model kuda beban yang dirancang untuk menangani keseluruhan rentang pekerjaan agen yang umum. Routing multi-tool, penyuntingan kode, percakapan yang berjalan lama, dan tugas structured-output. Tanpa premi biaya Opus.

Di seluruh jajaran Built-in VM0, multiplier kredit setiap model lain dinormalisasi terhadap Sonnet 4.6 (×1). Itu membuat Sonnet menjadi pilihan tepat ketika Anda menginginkan percakapan anggaran yang dapat diprediksi: "agen ini berjalan kira-kira 2× sebuah langkah Sonnet" adalah kalimat yang lebih berguna daripada kutipan dolar absolut yang bergerak tiap kuartal.

Sonnet 4.6 mendukung prompt caching Anthropic, yang membuat perbedaan besar bagi agen VM0 yang menghadirkan system prompt yang stabil dan skema tool yang tetap. Token input yang di-cache ditagih $0,30 per 1M alih-alih $3. Penghematan 10× pada bagian prompt yang tidak berubah antar giliran.

Apa yang menonjol dari Claude Sonnet 4.6

Fitur arsitektur dan kapabilitas utama.

Sonnet 4.6 hadir dengan jendela konteks 1M token pada harga standar, adaptive thinking yang diwarisi dari Opus 4.6, dan prompt caching yang menagih input yang di-cache sepersepuluh dari tarif input. Model ini menerima input multimodal mencakup teks, visi, dan kode.

Spesifikasi sekilas

KeluargaGenerasi Claude 4

ModalitasTeks, visi, kode

BahasaMengutamakan Inggris, multibahasa

Prompt cachingDidukung (Anthropic)

Jendela konteks1M token

Output maksimumHingga 64K token

Default untukVM0 Managed

Benchmark Claude Sonnet 4.6

Sonnet 4.6 berada kira-kira 3 sampai 4 poin persentase di belakang Opus 4.6 pada benchmark coding utama Anthropic, sambil tiga hingga lima kali lebih murah di tingkat vendor. Imbal balik Opus/Sonnet yang khas.

SWE-bench Verifieddilaporkan vendor

~77%

Recall konteks panjangobservasi internal

Kuat di 100K+

Tool routinginternal VM0

Terbaik di kelasnya pada ×1

Harga Claude Sonnet 4.6

Harga daftar vendor, per 1J token.

Input$3.00

Output$15.00

Cache read$0.30

Cache write$3.75

Bagaimana Claude Sonnet 4.6 berperilaku dalam praktik

Perilaku yang diamati dari eksekusi agen produksi.

Tool routing

Akurasi tool-routing terbaik di kelasnya pada harga ini. Pada alur multi-tool di Slack, GitHub, Linear, dan Notion, Sonnet 4.6 memilih tool yang benar dengan argumen yang benar lebih andal daripada model mana pun di bawah ×2.

Koherensi konteks panjang

Koheren di transkrip 100K+ token. Turun di bawah Opus 4.7 hanya pada jalannya yang terpanjang dan paling adversarial.

Kecepatan

Lebih cepat dari Opus dan lebih lambat dari Kimi K2.7 Code. Keseimbangan kecepatan/kualitas yang tepat untuk agen produksi.

Prediktabilitas biaya

Harganya adalah baseline kredit; prompt caching membuat biaya di-VM0 sangat dapat diprediksi untuk agen dengan system prompt yang tetap.

Tugas agen terbaik untuk Claude Sonnet 4.6

Agen Slack yang tahu di mana segala sesuatu berada

Mentriase pertanyaan masuk, menindaklanjuti thread yang macet, memposting pembaruan status, dan menjawab pertanyaan bergaya pencarian ("siapa yang menangani refactor auth?"). Akurasi tool-routing Sonnet berarti tool yang tepat dipanggil dengan argumen yang tepat pada percobaan pertama, bahkan ketika permintaannya ambigu, sehingga agen terasa andal alih-alih plin-plan.

Agen ulasan PR yang tidak tenggelam dalam kebisingan

Sonnet menangani sebagian besar pekerjaan yang sadar kode — ulasan PR, penyusunan kerangka tes, saran refactor, bisection bug — tanpa meninggalkan komentar gaya yang tidak diminta siapa pun. Jendela konteks 1M token memungkinkannya menarik file terkait dan ulasan sebelumnya saat penting, dan Anda hanya mengeskalasi ke Opus 4.7 untuk patch yang jelas-jelas membuat Sonnet kesulitan.

Agen riset yang melakukan 20 pemanggilan tool berturut-turut

GitHub plus Linear plus Notion plus web, dijahit bersama di lebih dari dua puluh giliran tool untuk menjawab pertanyaan seperti "mengapa pelanggan ini churn kuartal lalu?" Sonnet menjaga tujuan tetap dalam pandangan di sepanjang rantai dengan sebagian kecil biaya Opus, yang membuatnya berkelanjutan untuk riset sehari-hari alih-alih sekadar penelusuran mendalam sesekali.

Asisten dukungan pelanggan dengan system prompt yang stabil

Riwayat percakapan yang panjang, pemanggilan tool yang sering ke CRM, system prompt dan skema tool besar yang sama di setiap giliran. Prompt caching Sonnet mengubah prefix tetap itu menjadi sebagian kecil dari biaya input setelah pemanggilan pertama, yang menjaga biaya per percakapan tetap datar seiring volume bertambah.

Kapan melewatkan Claude Sonnet 4.6

Lewati Sonnet 4.6 pada langkah penalaran tersulit di mana ia jelas-jelas mengabaikan instruksi dan Anda sebaiknya mengeskalasi ke Opus 4.7, pada klasifikasi massal bervolume tinggi di mana GPT-5.4 Mini adalah opsi massal yang lebih murah dan didukung, serta pada balasan mikro yang kritis terhadap latensi di mana Kimi K2.7 Code jauh lebih cepat.

Claude Sonnet 4.6 vs model lain

Claude Sonnet 4.6 vs Claude Opus 4.7

Sonnet 4.6 adalah ×1; Opus 4.7 adalah ×2. Sonnet menangani sebagian besar agen; Opus adalah upgrade ketika kedalaman penalaran lebih penting daripada throughput. Banyak tim menggunakan Opus sebagai perencana dan Sonnet sebagai pekerja.

Claude Sonnet 4.6 vs DeepSeek V4 Pro

DeepSeek V4 Pro (×0,1) menyamai Sonnet pada benchmark coding (SWE-bench Verified dilaporkan vendor) dengan biaya jauh lebih rendah. Imbal baliknya adalah sedikit keandalan tool-routing dan profil keamanan yang kurang matang.

Claude Sonnet 4.6 vs GPT-5.4 Mini

GPT-5.4 Mini adalah opsi massal yang lebih murah di sisi OpenAI. Gunakan Sonnet ketika keandalan tool-routing lebih penting; gunakan Mini untuk prapenyaringan bervolume tinggi dan langkah sederhana yang tidak membutuhkan routing sekelas Sonnet.

Kesimpulan: haruskah Anda menggunakan Claude Sonnet 4.6?

Mulai di sini. Naik ke Opus 4.7 atau turun ke Kimi K2.7 Code / DeepSeek V4 Pro setelah Anda melihat perilaku produksi nyata dan tahu arah mana yang masuk akal.

Pertanyaan yang sering diajukan

Mengapa Sonnet 4.6 menjadi model default di VM0 Managed?

Ia mencapai keseimbangan terbaik antara kualitas penalaran, akurasi tool-routing, dan biaya di jajaran kami. Agen baru hampir selalu berfungsi di Sonnet tanpa penyetelan lebih lanjut.

Berapa jendela konteks Claude Sonnet 4.6?

1 juta token dengan output hingga 64K token per respons.

Apakah Sonnet 4.6 mendukung input gambar?

Ya. Model ini multimodal. Teks, kode, dan gambar.

Kapan saya harus berpindah dari Sonnet 4.6?

Beralih ke Opus 4.7 jika Sonnet jelas-jelas mengabaikan tujuan pada loop agen yang panjang atau gagal pada penyuntingan kode yang sulit. Beralih ke Kimi K2.7 Code atau GPT-5.4 Mini untuk alur sederhana bervolume tinggi di mana biaya menjadi penentu.

Apakah Sonnet 4.6 sama dengan Sonnet 4.5?

Tidak. 4.6 adalah generasi yang lebih baru di keluarga Claude 4 dengan perilaku konteks panjang yang lebih baik dan adaptive thinking. Harga vendor per tokennya identik.

Alternatif

Claude Opus 4.7

Gunakan ketika Sonnet mencapai batas penalarannya

DeepSeek V4 Pro

Alternatif jauh lebih murah dengan kualitas penalaran serupa

Menggunakan Claude Sonnet 4.6 di VM0

Dua cara mengakses Claude Sonnet 4.6 di VM0

VM0 mendukung Claude Sonnet 4.6 sebagai model Built-in yang ditagih dalam kredit VM0, dan melalui bring-your-own dengan Anthropic API key. Jalur Built-in menggunakan routing VM0 Managed dan pengali kredit yang dijelaskan di bawah; jalur bring-your-own menagih Anda langsung ke vendor hulu dan sepenuhnya melewati konversi kredit VM0.

Rekomendasi VM0

VM0 memposisikan Claude Sonnet 4.6 sebagai model agen inti, direkomendasikan bersama Claude Opus 4.7, Claude Opus 4.6, dan Claude Sonnet 4.6 untuk langkah-langkah yang menggerakkan hasil aktual dari sebuah eksekusi agen. Inilah model yang akan kami pilih untuk peran orkestrator, untuk agen yang menyentuh kode, dan untuk langkah apa pun di mana jawaban yang salah berbiaya mahal.

Kredit dan pengali ×1

Setiap model Built-in di VM0 dihargai sebagai kelipatan dari Claude Sonnet 4.6, yang berada di baseline kredit ×1. Claude Sonnet 4.6 ditagih pada ×1 kredit. Pengali inilah yang muncul di invoice VM0 Anda; harga daftar vendor di tabel harga di atas adalah yang dikenakan penyedia hulu sebelum VM0 mengonversinya menjadi kredit.

Claude Sonnet 4.6 berada di baseline ×1 yang menjadi acuan harga setiap model Built-in lainnya, jadi inilah satuan yang Anda gunakan untuk membandingkan biaya saat memilih antar model di VM0.

Tersedia di VM0 sejak Available since launch.