Claude Opus 4.7

Model Claude 4 flagship Anthropic. Pilihan terkuat dalam keluarganya untuk agent loop horizon panjang, reasoning sulit, dan suntingan kode percobaan pertama.

1M tokens · Text / Vision / Code · Prompt cache

Gunakan Claude Opus 4.7 di VM0

Claude Opus 4.7 adalah model yang Anda andalkan saat pekerjaan harus benar sejak percobaan pertama: kode yang ter-compile bersih, rencana multi-langkah yang tidak kehilangan benang merah di sepanjang rantai tool yang panjang, teka-teki abstrak yang membuat model lebih kecil tersandung. Benchmark vendor (SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2, OSWorld, BrowseComp) memberi angka konkret atas peningkatan dibanding Opus 4.6.

Harga daftar vendor adalah $5 / $25 per 1J token dengan cached input pada $0,50 / 1J, yang tertinggi dalam keluarga Claude. Pola yang hemat biaya adalah menjaga Sonnet 4.6 sebagai default dan mengarahkan hanya langkah tersulit ke Opus.

Apa itu Claude Opus 4.7?

April 2026 (menggantikan Opus 4.6) · Tier teratas dari keluarga Claude 4. Upgrade yang direkomendasikan Anthropic untuk pengguna Opus 4.6.

Claude Opus 4.7 adalah flagship dari keluarga Claude 4 milik Anthropic, dirilis pada April 2026 sebagai upgrade yang direkomendasikan dari Opus 4.6. Anthropic membingkainya sebagai peningkatan menyeluruh pada agentic coding dan reasoning abstrak alih-alih penyegaran di permukaan API. Jendela konteks 1J token dan tingkat effort adaptive-thinking yang diperkenalkan di 4.6 dibawa tanpa perubahan, sehingga kode agen yang ada bisa langsung dipasang tanpa penulisan ulang.

Dibanding Sonnet 4.6 (workhorse di keluarga yang sama), Opus menanamkan lebih banyak komputasi per token. Imbal hasil perilakunya muncul di tiga tempat: lebih sedikit instruksi yang terjatuh pada agent loop panjang, patch kode percobaan pertama yang jauh lebih baik, dan recall yang lebih kuat begitu riwayat percakapan tumbuh melewati 100K token. Trade-off-nya adalah harga daftar tertinggi dalam keluarga Claude ($5 / $25 per 1J token) dan kecepatan output per-token yang lebih lambat, yang menjadi alasan Anthropic sendiri memposisikan Opus sebagai tier orkestrator atau eskalasi alih-alih default di mana-mana.

Leaderboard independen (Artificial Analysis, Vellum) mengukuhkan urutan relatif terhadap Opus 4.6, tapi angka absolut bergeser tiap minggu dan OpenAI telah menandai kontaminasi data pelatihan pada SWE-bench Verified di seluruh model frontier. Perlakukan skor publik sebagai indikatif alih-alih otoritatif; perbedaan perilaku terstruktur (koherensi loop panjang, kualitas patch percobaan pertama, keandalan routing multi-tool) adalah sinyal yang lebih tahan lama.

Apa yang menonjol dari Claude Opus 4.7

Fitur arsitektur dan kapabilitas utama.

Opus 4.7 mempertahankan jendela konteks 1J token dari Opus 4.6, ditagih pada harga input standar di seluruh jendela. Ia mendukung adaptive thinking pada empat tingkat effort (low, medium, high, dan max), Compaction API untuk peringkasan konteks sisi-server pada eksekusi panjang, dan prompt caching di mana cached input ditagih sepersepuluh dari tarif input. Permukaan multi-agen dan tool-use tidak berubah dari 4.6, termasuk Mailbox Protocol untuk tim agen peer-to-peer dan parameter inference_geo yang mengekspos inferensi khusus-AS pada pengali 1,1×. Input bersifat multimodal lintas teks, vision, dan kode.

Spesifikasi sekilas

KeluargaGenerasi Claude 4

ModalitasTeks, vision, kode

BahasaMengutamakan Inggris, multibahasa

Prompt cachingDidukung (Anthropic)

Jendela konteks1J token

Output maksimumHingga 64K token

Tingkat effortLow / Medium / High / Max

Harga daftar vendor$5 input / $25 output per 1J

Benchmark Claude Opus 4.7

Skor yang dilaporkan vendor dari materi rilis Opus 4.7 milik Anthropic, dengan delta yang ditampilkan terhadap angka Opus 4.6 publik. Ulasan independen menempatkan 4.7 di atas GPT-5.2 pada sebagian besar tugas agentic-coding dan dalam selisih beberapa poin dari Gemini 3 Pro pada reasoning abstrak. Perlakukan persentase absolut sebagai indikatif; OpenAI telah menandai kontaminasi data pelatihan pada SWE-bench Verified di seluruh model frontier.

SWE-bench Verifieddilaporkan vendor; naik dari 80,8% milik Opus 4.6

~83,5%

SWE-bench Prodilaporkan vendor

Memimpin keluarga Claude saat rilis

Terminal-Bench 2.0dilaporkan vendor; naik dari 65,4% milik Opus 4.6

~71%

τ2-bench Retailtool-use yang dilaporkan vendor

~93%

OSWorld (computer use)dilaporkan vendor; naik dari 72,7% milik Opus 4.6

~76%

BrowseComptugas web yang dilaporkan vendor

~88%

ARC AGI 2dilaporkan vendor; naik dari 68,8% milik Opus 4.6

~75%

Humanity's Last Exam (dengan tools)dilaporkan vendor

Memimpin keluarga Claude

GPQA Diamondsains tingkat pascasarjana yang dilaporkan vendor

~92%

MRCR v2 (1J, 8-needle)recall konteks panjang

Membaik dari 76% milik 4.6

MMMU Pro (multimodal)dilaporkan vendor

Memimpin keluarga Claude

Harga Claude Opus 4.7

Harga daftar vendor, per 1J token.

Input$5.00

Output$25.00

Cache read$0.50

Cache write$6.25

Bagaimana Claude Opus 4.7 berperilaku dalam praktik

Perilaku yang diamati dari eksekusi agen produksi.

Tool routing

Tingkat tool call salah-rute terendah dalam keluarga Claude. Selisih dibanding Sonnet 4.6 melebar pada edge case sulit seperti pemilihan tool kondisional, argumen yang bersarang dalam, dan tool call yang dikirim setelah rentang reasoning yang panjang.

Recall konteks panjang

Koheren di sepanjang transkrip agen 200K+ token. Jendela 1J token bertahan jauh lebih baik daripada pendahulunya berkat peningkatan context-rot yang diperkenalkan Anthropic di Opus 4.6 dan dipertajam lebih jauh untuk 4.7. MRCR v2 yang dilaporkan vendor pada 1J menunjukkan kenaikan terukur atas 76% milik Opus 4.6.

Suntingan kode percobaan pertama

Kualitas patch terkuat dalam keluarga Claude. Pilihan tepat saat agen harus memodifikasi kode yang harus tetap ter-compile dan lolos pengujian, terutama saat patch membentang di banyak file. Hasil Terminal-Bench 2.0 milik Anthropic mencerminkan ini secara langsung.

Kecepatan

Lebih lambat dari Sonnet 4.6 dan jauh lebih lambat dari Kimi K2.7 Code. Anthropic mempublikasikan ~41 token/detik pada effort max untuk Opus 4.6, dan 4.7 berada di rentang serupa. Cadangkan untuk langkah-langkah yang benar-benar membutuhkan kedalaman reasoning ekstra dan jalankan tier yang lebih ringan secara paralel.

Perilaku halusinasi

Opus 4.7 mempertahankan postur penolakan konservatif Anthropic dan cenderung mengakui ketidakpastian alih-alih mengarang, yang menjadi alasan tim produksi terus membayar premium untuk reasoning berisiko tinggi meski alternatif open-weight yang lebih murah seperti Kimi K2.7 Code dan DeepSeek V4 Pro kini menyamainya pada benchmark.

Tugas agen terbaik untuk Claude Opus 4.7

Peninjauan PR yang menangkap apa yang dilewatkan manusia

Saat sebuah pull request mengubah 30 file, Opus 4.7 menyimpan seluruh perubahan dalam memori kerja dan menulis peninjauan yang mengaitkan apa yang berubah di auth/middleware.ts dengan pengujian yang dirusaknya di routes/admin.test.ts. Reviewer junior mendapat jenis umpan balik lintas-file yang biasanya hanya ditangkap engineer senior pada peninjauan kedua, dan tim mengirim lebih sedikit patch yang lolos CI tapi rusak di produksi.

Eksekusi riset yang membaca seluruh tumpukan

Masukkan draf kontrak 200 halaman, tiga proposal kompetitor, dan opini hukum kuartal lalu ke dalam jendela konteks 1J token, lalu minta Opus menandai setiap klausul yang lebih ketat dari standar pasar dan mendaftar kemungkinan poin negosiasi. Model lebih kecil mulai menjatuhkan bagian-bagian awal setelah 100K token; Opus menjaga seluruh gambaran tetap terlihat dan merujuk paragraf persis yang dikutipnya.

Orkestrator yang menjalankan rencana multi-tool

Gunakan Opus 4.7 sebagai perencana yang memecah permintaan pelanggan menjadi sepuluh langkah, mengirim setiap langkah ke sub-agen Sonnet atau yang penghemat biaya, dan menjahit kembali hasilnya. Menjalankan Opus hanya di lapisan perencana (dan tier yang lebih murah di tempat lain) berbiaya sebagian kecil dari menjalankan Opus dari ujung ke ujung, dengan sebagian besar kualitas tetap terjaga.

Suntingan kode percobaan pertama yang tidak menyia-nyiakan eksekusi CI

Minta Opus 4.7 memigrasikan codebase 50-file dari satu ORM ke ORM lain, merefaktor modul yang ruwet, atau menerapkan perbaikan keamanan di seluruh repo. Patch terpasang bersih pada percobaan pertama lebih sering daripada model lain mana pun dalam keluarga, yang dicerminkan oleh Terminal-Bench 2.0 yang dilaporkan vendor, dan yang juga akan dicerminkan tagihan CI Anda.

Kapan melewatkan Claude Opus 4.7

Lewatkan Opus 4.7 pada pekerjaan rutin bervolume tinggi di mana Sonnet 4.6 mencapai standar kualitas yang sama dengan biaya jauh lebih kecil, pada balasan chat sensitif-latensi di mana Kimi K2.7 Code jauh lebih cepat, dan pada pekerjaan klasifikasi atau ekstraksi massal di mana GPT-5.4 Mini adalah opsi massal yang lebih murah dan didukung.

Claude Opus 4.7 vs model lain

Claude Opus 4.7 vs Claude Opus 4.8

Opus 4.8 adalah flagship yang lebih baru pada pengali VM0 yang sama. Gunakan 4.8 untuk agen berisiko tinggi yang baru; pertahankan 4.7 hanya saat sebuah alur kerja yang ada telah divalidasi terhadapnya dan stabilitas lebih penting daripada peningkatan benchmark terbaru.

Claude Opus 4.7 vs Claude Sonnet 4.6

Sonnet 4.6 adalah workhorse default dalam keluarga Claude dan pilihan tepat untuk sebagian besar agen. Naikkan ke Opus 4.7 hanya saat Sonnet jelas gagal pada reasoning sulit, konteks panjang, atau suntingan kode percobaan pertama, biasanya sebagai orkestrator yang mendelegasikan ke bawah ke sub-agen Sonnet atau yang penghemat biaya.

Claude Opus 4.7 vs Claude Opus 4.6

Jendela konteks sama (1J token), harga vendor sama, dan arsitektur adaptive-thinking yang sama. Opus 4.7 adalah generasi yang lebih baru dengan peningkatan yang dilaporkan vendor di SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2, dan OSWorld. Pilih 4.7 untuk agen baru; pin 4.6 hanya saat agen yang ada telah divalidasi terhadap versi itu dan Anda butuh stabilitas perilaku.

Claude Opus 4.7 vs Kimi K2.7 Code

Kimi K2.7 Code milik Moonshot memimpin beberapa benchmark agentik di frontier open-source (SWE-bench Pro yang dilaporkan vendor 58,6 dibanding 53,4 milik Opus 4.6). Opus 4.7 mempertahankan keunggulan pada keandalan tool-routing untuk agen produksi berbahasa Inggris dan pada profil keamanan, yang menjadi alasan sebagian besar tim enterprise tetap menjadikannya tier berisiko tinggi.

Claude Opus 4.7 vs DeepSeek V4 Pro

DeepSeek V4 Pro tertinggal dari Opus pada sebagian besar benchmark reasoning tapi menyamainya pada coding (SWE-bench Verified yang dilaporkan vendor dalam selisih ~0,2 poin). Pembagiannya jelas: pilih DeepSeek saat biaya mentah mendominasi, pilih Opus 4.7 saat keandalan, profil keamanan, atau akurasi tool-routing lebih penting daripada harga per-panggilan.

Kesimpulan: haruskah Anda menggunakan Claude Opus 4.7?

Opus 4.7 adalah tier eskalasi. Default-kan ke Sonnet 4.6; naikkan ke Opus hanya pada langkah-langkah spesifik di mana Sonnet jelas gagal.

Pertanyaan yang sering diajukan

Berapa jendela konteks Claude Opus 4.7?

1 juta token, dengan hingga 64K token output per respons. Seluruh jendela ditagih pada tarif standar. Permintaan 900K token memiliki tarif per-token yang sama dengan permintaan 9K token.

Bisakah Claude Opus 4.7 menangani gambar?

Ya. Opus 4.7 bersifat multimodal. Ia menerima input gambar bersama teks dan kode, sehingga agen berbasis screenshot dan document-vision bekerja secara native.

Kapan saya harus memilih Opus 4.7 dibanding Sonnet 4.6?

Saat (a) agen adalah perencana / orkestrator dan keputusan berdampak berantai, (b) eksekusinya cukup panjang sehingga Sonnet mulai menjatuhkan instruksi, atau (c) output harus terpasang bersih pada percobaan pertama (suntingan kode, payload terstruktur).

Haruskah saya migrasi dari Opus 4.6 ke Opus 4.7?

Ya. Anthropic secara eksplisit merekomendasikan 4.7 dibanding 4.6. Pengali sama, perilaku lebih kuat. Migrasikan agen produksi yang di-pin hanya setelah menjalankannya melalui suite regresi Anda.

Apakah Opus 4.7 mendukung prompt caching?

Ya. Cached input ditagih pada $0,50 per 1J token. Diskon 10× pada porsi yang di-cache. Layak digunakan kapan pun system prompt atau skema tool Anda stabil di sepanjang panggilan.

Alternatif

Claude Opus 4.8

Flagship yang lebih baru untuk agen berisiko tinggi

Claude Sonnet 4.6

Default yang lebih murah untuk sebagian besar agent loop

Kimi K2.7 Code

Alternatif coding open-weight yang hemat biaya

Menggunakan Claude Opus 4.7 di VM0

Dua cara mengakses Claude Opus 4.7 di VM0

VM0 mendukung Claude Opus 4.7 sebagai model Built-in yang ditagih dalam kredit VM0, dan melalui bring-your-own dengan Anthropic API key. Jalur Built-in menggunakan routing VM0 Managed dan pengali kredit yang dijelaskan di bawah; jalur bring-your-own menagih Anda langsung ke vendor hulu dan sepenuhnya melewati konversi kredit VM0.

Rekomendasi VM0

VM0 memposisikan Claude Opus 4.7 sebagai model agen inti, direkomendasikan bersama Claude Opus 4.7, Claude Opus 4.6, dan Claude Sonnet 4.6 untuk langkah-langkah yang menggerakkan hasil aktual dari sebuah eksekusi agen. Inilah model yang akan kami pilih untuk peran orkestrator, untuk agen yang menyentuh kode, dan untuk langkah apa pun di mana jawaban yang salah berbiaya mahal.

Kredit dan pengali ×2

Setiap model Built-in di VM0 dihargai sebagai kelipatan dari Claude Sonnet 4.6, yang berada di baseline kredit ×1. Claude Opus 4.7 ditagih pada ×2 kredit. Pengali inilah yang muncul di invoice VM0 Anda; harga daftar vendor di tabel harga di atas adalah yang dikenakan penyedia hulu sebelum VM0 mengonversinya menjadi kredit.

Claude Opus 4.7 ditagih pada ×2, yang berarti satu langkah di sini berbiaya 2× kredit dari langkah setara pada Sonnet 4.6 (baseline ×1). Ini tier premium di VM0, jadi pola yang hemat biaya adalah menggunakan model yang lebih murah sebagai default dan mengarahkan ke Claude Opus 4.7 hanya langkah yang benar-benar membutuhkan kedalaman reasoning ekstra.

Tersedia di VM0 sejak April 17, 2026.