Semua model

Claude Opus 4.6 di VM0

Model andalan Anthropic sebelumnya. Multiplier dan konteks 1M yang sama seperti Opus 4.7. Tetap sematkan hanya ketika sebuah agen sudah divalidasi pada versi persis ini.

1M tokens · Text / Vision / Code · Prompt cache

Claude Opus 4.6 adalah model andalan Anthropic sebelum Opus 4.7 dan memperkenalkan sebagian besar hal yang kini mendefinisikan keluarga Claude 4: jendela konteks 1M token dalam versi beta, adaptive thinking dengan empat tingkat upaya, dan skor agentic coding tertinggi yang pernah dirilis Anthropic saat itu (dilaporkan vendor: SWE-bench Verified 80,8%, Terminal-Bench 2.0 65,4%, OSWorld 72,7%).

Harga daftar vendor sama dengan 4.7, yaitu $5 / $25 per 1M token. Satu-satunya alasan kuat untuk tetap di 4.6 adalah stabilitas perilaku bagi agen yang sudah divalidasi terhadap versi ini; apa pun yang baru sebaiknya dimulai di 4.7.

Apa itu Claude Opus 4.6?

5 Februari 2026 · Tingkat teratas sebelumnya dari keluarga Claude 4. Digantikan oleh Claude Opus 4.7.

Claude Opus 4.6 adalah model frontier Anthropic sebelum Opus 4.7. Model ini dirilis pada 5 Februari 2026 dan memperkenalkan beberapa kemampuan yang mendefinisikan keluarga Claude 4. Adaptive thinking dengan empat tingkat upaya, jendela konteks 1M token dalam versi beta, dan skor agentic coding tertinggi Anthropic saat peluncuran.

Di VM0 model ini berada pada multiplier kredit ×2 yang sama seperti Opus 4.7. Anthropic secara eksplisit merekomendasikan migrasi ke 4.7 untuk pekerjaan baru; sematkan 4.6 hanya jika agen tertentu sudah divalidasi terhadap versi ini dan Anda belum ingin menjalankan ulang uji regresi.

Apa yang menonjol dari Claude Opus 4.6

Fitur arsitektur dan kapabilitas utama.

Opus 4.6 memperkenalkan adaptive thinking dengan empat tingkat upaya (rendah, sedang, tinggi, dan maks, dengan tinggi sebagai default) serta jendela konteks 1M token dalam versi beta pada harga standar. Model ini menambahkan Compaction API untuk peringkasan konteks di sisi server, menonaktifkan prefilling sebagai breaking change dibandingkan Opus 4.5 (gunakan structured outputs sebagai gantinya), dan menghadirkan Mailbox Protocol untuk tim peer-to-peer multi-agen. Parameter inference_geo mengekspos inferensi khusus AS dengan multiplier 1,1×.

Spesifikasi sekilas

KeluargaGenerasi Claude 4
ModalitasTeks, visi, kode
BahasaMengutamakan Inggris, multibahasa
Prompt cachingDidukung (Anthropic)
Jendela konteks1M token (beta)
Output maksimumHingga 128K token
Tersedia di VM0Tersedia sejak peluncuran

Benchmark Claude Opus 4.6

Skor yang dilaporkan vendor dari materi rilis Opus 4.6 Anthropic dan Artificial Analysis. Perlakukan angka absolut SWE-bench dengan hati-hati. OpenAI menandai adanya kontaminasi data pelatihan pada SWE-bench Verified di seluruh model frontier.

SWE-bench Verifieddilaporkan vendor
80,8%
Terminal-Bench 2.0dilaporkan vendor
65,4%
OSWorld (computer use)dilaporkan vendor
72,7%
MRCR v2 (1M, 8-needle)dilaporkan vendor
76%
Artificial Analysis Intelligence Indexupaya maks
53
KecepatanArtificial Analysis
~41 token/dtk

Harga Claude Opus 4.6

Harga daftar vendor, per 1J token.

Input$15.00
Output$75.00
Cache read$1.50
Cache write$18.75

Bagaimana Claude Opus 4.6 berperilaku dalam praktik

Perilaku yang diamati dari eksekusi agen produksi.

Penalaran

Kuat pada langkah penalaran yang sulit. Opus 4.7 sedikit lebih baik dengan biaya vendor yang sedikit lebih rendah. Tidak ada kategori benchmark di mana 4.6 unggul.

Penggunaan tool

Andal di seluruh alur agen multi-tool. Sekelas dengan Sonnet 4.6 dalam akurasi routing dengan ketahanan ekstra pada kasus edge.

Konteks panjang

Konteks 1M token dengan recall MRCR v2 76%. Benar-benar dapat digunakan di seluruh jendela, bukan sekadar nominal.

Kecepatan

Lebih lambat dari Sonnet 4.6 dan Kimi K2.7 Code; sebanding dengan Opus 4.7. Sekitar 41 token/dtk pada upaya maks menurut Artificial Analysis.

Tugas agen terbaik untuk Claude Opus 4.6

Agen produksi yang sudah membayar biayanya sendiri

Tim Anda menghabiskan dua minggu menyetel prompt dan skema tool terhadap Opus 4.6, agennya sudah live selama sebulan, dan pelanggan puas. Menyematkan ke 4.6 menjaga perilaku tetap identik sementara Anda memutuskan apakah upgrade ke 4.7 sepadan dengan siklus validasi ulang, alih-alih membiarkan Anthropic mengupgrade trafik Anda secara otomatis dan diam-diam menggeser output di baliknya.

Baseline regresi untuk peluncuran Opus 4.7

Jalankan set prompt yang sama melalui 4.6 dan 4.7 secara berdampingan, bandingkan output-nya, dan tentukan di mana upgrade benar-benar mengubah perilaku sebelum Anda mengaktifkannya di produksi. Harga vendor yang sama, multiplier yang sama, antarmuka yang identik — satu-satunya yang berbeda adalah bobot model, yang justru itulah yang Anda inginkan saat mengisolasi regresi.

Kapan melewatkan Claude Opus 4.6

Jangan mulai agen baru di Opus 4.6 kecuali Anda punya alasan konkret, karena 4.7 hadir dengan multiplier yang sama disertai perilaku yang lebih kuat dan harga daftar vendor yang lebih rendah. Apa pun yang sensitif terhadap biaya sebaiknya diarahkan ke 4.7 dengan alasan yang sama.

Claude Opus 4.6 vs model lain

Claude Opus 4.6 vs Claude Opus 4.7

Multiplier ×2 dan jendela konteks 1M yang sama. Opus 4.7 lebih baru, lebih cepat, dan harga daftar vendornya lebih rendah. Sematkan 4.6 hanya jika Anda sudah berinvestasi menyetel terhadap versi ini.

Claude Opus 4.6 vs Claude Sonnet 4.6

Sonnet 4.6 berada di ×1 dan menangani sebagian besar loop agen. Gunakan Opus hanya ketika Sonnet jelas-jelas gagal. Biasanya untuk orkestrasi atau penyuntingan kode yang sulit.

Claude Opus 4.6 vs Kimi K2.7 Code

Kimi K2.7 Code (×0,3) sedikit mengungguli Opus 4.6 pada SWE-bench Pro (58,6 vs 53,4 dilaporkan vendor) dan jauh lebih murah. Opus 4.6 mempertahankan keunggulan profil keamanan dan menjadi pilihan default enterprise Barat.

Kesimpulan: haruskah Anda menggunakan Claude Opus 4.6?

Sematkan jika Anda sudah memvalidasinya; jika tidak, mulai di Opus 4.7. Migrasinya hanya perubahan pengaturan, bukan penulisan ulang.

Pertanyaan yang sering diajukan

Kapan Claude Opus 4.6 dirilis?

Anthropic merilis Opus 4.6 pada 5 Februari 2026. Opus 4.7 menyusul tak lama kemudian.

Apakah saya harus migrasi dari Opus 4.6 ke Opus 4.7?

Ya untuk pekerjaan baru. Multiplier sama, konteks 1M sama, harga daftar vendor lebih rendah, perilaku lebih kuat pada tugas agentic coding. Migrasikan agen yang disematkan hanya setelah menjalankannya melalui rangkaian uji regresi Anda.

Berapa jendela konteks Claude Opus 4.6?

1 juta token (beta) dengan output hingga 128K token per respons.

Mengapa Opus 4.6 menjadi default pada provider API key Anthropic?

Default historis dari sebelum Opus 4.7 diluncurkan. Anda dapat mengganti agen mana pun ke Opus 4.7, Sonnet 4.6, atau Kimi K2.7 Code di VM0 Settings → Model Providers tanpa mengubah API key.

Apa itu adaptive thinking?

Lapisan penjadwalan yang memungkinkan Claude memutuskan berapa banyak komputasi penalaran yang dihabiskan per giliran. Empat tingkat. Rendah, sedang, tinggi, maks. Dengan tinggi sebagai default. Menggantikan tombol extended-thinking milik Opus 4.5.

Alternatif

Menggunakan Claude Opus 4.6 di VM0

Dua cara mengakses Claude Opus 4.6 di VM0

VM0 mendukung Claude Opus 4.6 sebagai model Built-in yang ditagih dalam kredit VM0, dan melalui bring-your-own dengan Anthropic API key. Jalur Built-in menggunakan routing VM0 Managed dan pengali kredit yang dijelaskan di bawah; jalur bring-your-own menagih Anda langsung ke vendor hulu dan sepenuhnya melewati konversi kredit VM0.

Rekomendasi VM0

VM0 memposisikan Claude Opus 4.6 sebagai model agen inti, direkomendasikan bersama Claude Opus 4.7, Claude Opus 4.6, dan Claude Sonnet 4.6 untuk langkah-langkah yang menggerakkan hasil aktual dari sebuah eksekusi agen. Inilah model yang akan kami pilih untuk peran orkestrator, untuk agen yang menyentuh kode, dan untuk langkah apa pun di mana jawaban yang salah berbiaya mahal.

Kredit dan pengali ×2

Setiap model Built-in di VM0 dihargai sebagai kelipatan dari Claude Sonnet 4.6, yang berada di baseline kredit ×1. Claude Opus 4.6 ditagih pada ×2 kredit. Pengali inilah yang muncul di invoice VM0 Anda; harga daftar vendor di tabel harga di atas adalah yang dikenakan penyedia hulu sebelum VM0 mengonversinya menjadi kredit.

Claude Opus 4.6 ditagih pada ×2, yang berarti satu langkah di sini berbiaya 2× kredit dari langkah setara pada Sonnet 4.6 (baseline ×1). Ini tier premium di VM0, jadi pola yang hemat biaya adalah menggunakan model yang lebih murah sebagai default dan mengarahkan ke Claude Opus 4.6 hanya langkah yang benar-benar membutuhkan kedalaman reasoning ekstra.

Tersedia di VM0 sejak Available since launch.