Semua model

DeepSeek V4 Pro di VM0. Penalaran teroptimasi biaya

Model penalaran flagship V4 dari DeepSeek. Terpaut 0,2 poin dari Claude Opus 4.6 pada SWE-bench Verified dengan biaya sepertujuh dari biaya vendor. API kompatibel dengan Claude.

1M tokens · Text / Code · Prompt cache

DeepSeek V4 Pro adalah flagship dari generasi V4 DeepSeek — MoE open-weight 1.6T-parameter di bawah lisensi MIT. Sorotannya adalah rasio harga terhadap kualitas: SWE-bench Verified yang dilaporkan vendor adalah 80.6%, hanya terpaut sebagian kecil poin dari Claude Opus 4.6, dengan sekitar sepertujuh dari biaya vendor Anthropic. Hal itu membuat agen yang berat penalaran — review PR massal, analisis dokumen batch, peringkasan terjadwal — terjangkau dalam volume tinggi.

Harga daftar vendor adalah $1.74 / $3.48 per 1M token dengan cache read $0.028 / 1M dan cache write gratis (unik di jajaran ini). Konteks 1M token, API kompatibel dengan Anthropic. Pilih Sonnet 4.6 ketika keandalan tool-routing di produksi menjadi faktor penentu, dan pilih GPT-5.4 Mini atau Kimi K2.7 Code ketika pekerjaan massal single-shot tidak membutuhkan kedalaman penalaran V4 Pro.

Apa itu DeepSeek V4 Pro?

24 April 2026 · Varian penalaran dari keluarga DeepSeek V4, berfokus pada kualitas penalaran maksimal.

DeepSeek V4 Pro adalah flagship dari generasi V4 DeepSeek, dirilis 24 April 2026 di bawah MIT License. Ini adalah model Mixture-of-Experts open-weight dengan total 1.6T parameter dan 49B aktif per token.

V4 Pro mendukung jendela konteks 1M token, output maksimum 384K, tiga mode reasoning effort (standard, think, think-max), output JSON, panggilan tool, dan FIM completion dalam mode non-think. Model Pro menambahkan arsitektur hybrid attention (Compressed Sparse Attention + Heavily Compressed Attention) untuk efisiensi konteks panjang yang meningkat drastis. 27% dari FLOP inferensi single-token dan 10% dari KV cache dibanding DeepSeek V3.2 pada konteks 1M.

DeepSeek menggebrak sepanjang 2025 dengan menghadirkan penalaran setara Anthropic dengan harga sebagian kecilnya. V4 Pro melanjutkan pola itu: SWE-bench Verified 80.6% yang dilaporkan vendor berada dalam 0,2 poin dari Claude Opus 4.6, dengan sekitar sepertujuh dari biaya vendor. Di VM0 model ini tersedia melalui provider API-key DeepSeek dan di VM0 Managed dengan ×0.1. Pengali lebih rendah daripada Kimi K2.7 Code, dengan perilaku penalaran yang jauh lebih kuat.

Apa yang menonjol dari DeepSeek V4 Pro

Fitur arsitektur dan kapabilitas utama.

V4 Pro adalah model Mixture-of-Experts dengan total 1.6T parameter dan 49B aktif per token, didukung tumpukan hybrid attention (Compressed Sparse Attention plus Heavily Compressed Attention) yang menjaga inferensi konteks panjang tetap murah. Model ini mendukung jendela konteks 1M token dengan output maksimum 384K, tiga mode reasoning effort (standard, think, dan think-max), serta menggunakan Manifold-Constrained Hyper-Connections untuk propagasi sinyal yang stabil. Model dilatih pada 32T+ token dengan optimizer Muon dan dirilis di bawah MIT License dengan open weights.

Spesifikasi sekilas

KeluargaSeri DeepSeek V4
ParameterTotal 1.6T / 49B aktif (MoE)
ModalitasTeks, kode
BahasaMultibahasa
Jendela konteks1M token
Output maksimum384K token
LisensiMIT (open weights)
Tersedia di VM024 April 2026

Benchmark DeepSeek V4 Pro

Skor yang dilaporkan vendor dari rilis V4 Pro DeepSeek. Ulasan independen (Geeky Gadgets, Code Arena) menempatkan V4 Pro di peringkat ketiga pada Code Arena di belakang GLM-5.1 dan Kimi K2.7 Code. Klaim benchmark terkuat berasal dari materi DeepSeek sendiri. Perlakukan secara arah saja, bukan sebagai kebenaran absolut.

SWE-bench Verifieddilaporkan vendor; terpaut 0,2 poin dari Opus 4.6
80.6%
Terminal-Bench 2.0dilaporkan vendor; mengungguli Opus 4.6
67.9%
LiveCodeBenchdilaporkan vendor
93.5%
Codeforces ratingdilaporkan vendor
3206
MMLU-Prodilaporkan vendor
Setara GPT-5.4
Artificial Analysis Intelligence Indexmax effort
52
KecepatanArtificial Analysis
~36 token/detik

Harga DeepSeek V4 Pro

Harga daftar vendor, per 1J token.

Input$1.74
Output$3.48
Cache read$0.14
Cache writeTidak ditagih

Bagaimana DeepSeek V4 Pro berperilaku dalam praktik

Perilaku yang diamati dari eksekusi agen produksi.

Penalaran

Penalaran sub-Sonnet terkuat di jajaran kami. Bertahan pada pekerjaan multi-langkah ketika model yang lebih murah mulai melenceng. MMLU-Pro yang dilaporkan vendor setara GPT-5.4.

Benchmark coding

SWE-bench Verified 80.6% yang dilaporkan vendor (dalam 0,2 dari Opus 4.6), Terminal-Bench 2.0 67.9% (mengungguli Opus 4.6), LiveCodeBench 93.5%.

Efisiensi biaya

Properti yang menonjol. Biaya kredit ×0.1 dengan penalaran yang bersaing baik dengan Sonnet 4.6 membuat V4 Pro menjadi default optimasi biaya, jauh lebih murah daripada Claude Opus 4.7.

Ekonomi cache

Cache write gratis. Unik di antara model Built-in VM0. System prompt yang stabil dan dokumen referensi besar yang ditempel tidak menambah biaya apa pun untuk dicache, hanya sisi read yang ditagih.

Kecepatan

Sekitar 36 token/detik pada max effort menurut Artificial Analysis. Lebih lambat daripada Kimi K2.7 Code, sedikit lebih lambat daripada Opus 4.6.

Tugas agen terbaik untuk DeepSeek V4 Pro

Agen review PR yang berjalan di setiap commit

Akurasi setara Sonnet dengan sebagian kecil biaya vendor Sonnet-lah yang membuat "review setiap commit, bukan hanya PR besar" benar-benar layak. V4 Pro membaca diff, file-file terkait, dan issue yang ditautkan, lalu menulis komentar terstruktur — dan harga per panggilannya cukup rendah sehingga menjalankannya sebagai langkah CI di setiap push tidak muncul sebagai item biaya yang mencolok.

Peringkas terjadwal yang berjalan setiap malam

Menarik percakapan pelanggan, tiket support, atau panggilan penjualan kemarin lalu menulis ringkasan. System prompt dan skema tool tidak berubah antar proses, dan DeepSeek tidak menagih cache write — sehingga prefix tetap yang panjang dibayar sekali dan cache read berbiaya sebagian kecil dari input normal. Di sinilah model harga V4 Pro benar-benar mengubah apa yang terjangkau.

Agen kode seluruh repo yang biayanya lebih rendah dari Opus

Konteks 1M token dengan hybrid attention (Compressed Sparse Attention plus Heavily Compressed Attention) berarti basis kode berukuran sedang muat dalam satu prompt dan biaya inferensi tetap terkendali saat jendela terisi. Untuk refactor lintas file dan review tingkat arsitektur, di sinilah Anda mendapatkan alur kerja "lihat semuanya sekaligus" gaya Opus tanpa tagihan gaya Opus.

Kapan melewatkan DeepSeek V4 Pro

Lewati V4 Pro pada kasus tepi tool-routing tersulit di mana Sonnet 4.6 masih unggul, dan pada pekerjaan massal single-shot di mana GPT-5.4 Mini atau Kimi K2.7 Code sudah memadai dengan biaya lebih rendah.

DeepSeek V4 Pro vs model lain

DeepSeek V4 Pro vs Claude Sonnet 4.6

Sonnet 4.6 (×1) menang pada kasus tepi tool-routing dan penalaran berbahasa Inggris. V4 Pro (×0.1) menang soal biaya dan kompetitif pada benchmark coding (dilaporkan vendor). Layak diuji A/B pada agen nyata sebelum berkomitmen.

DeepSeek V4 Pro vs Kimi K2.7 Code

Pengali lebih rendah daripada Kimi (×0.1 vs ×0.3). Kimi memiliki recall konteks panjang yang lebih kuat dan Intelligence Index yang lebih tinggi (54 vs 52); V4 Pro memiliki ekonomi cache yang lebih baik (write gratis) dan jendela konteks 1M vs 256K milik Kimi. Pilih berdasarkan properti mana yang lebih penting.

DeepSeek V4 Pro vs GLM-5.2

GLM-5.2 adalah jalur default Z.AI saat ini di VM0. Ia menjadi perbandingan yang lebih tepat untuk agen baru yang didukung Z.AI, sementara GLM-5.1 tetap tersedia hanya untuk kompatibilitas dengan alur kerja yang sudah disetel.

Kesimpulan: haruskah Anda menggunakan DeepSeek V4 Pro?

Pra-filter dengan GPT-5.4 Mini atau Kimi K2.7 Code, eskalasi ke V4 Pro untuk penalaran, eskalasi ke Sonnet 4.6 hanya ketika V4 Pro tersendat pada kasus tepi tool-routing.

Pertanyaan yang sering diajukan

Kapan DeepSeek V4 Pro dirilis?

DeepSeek merilis V4 Pro pada 24 April 2026 di bawah MIT License dengan open weights.

Mengapa cache write gratis?

DeepSeek tidak menagih bagian cache-write. Hanya cache read yang ditagih, seharga $0.145 per 1M token. System prompt yang stabil dan konteks referensi besar tidak menambah biaya apa pun untuk dicache.

Berapa jendela konteks V4 Pro?

1 juta token dengan output hingga 384K token. Arsitektur hybrid attention membuat seluruh jendela dapat digunakan dengan biaya inferensi yang jauh lebih rendah daripada V3.2.

Bagaimana V4 Pro dibandingkan dengan Claude Opus 4.6?

SWE-bench Verified yang dilaporkan vendor terpaut dalam 0,2 poin (80.6 vs 80.8). Terminal-Bench 2.0 menguntungkan V4 Pro (67.9 vs 65.4). Opus 4.6 unggul pada HLE (40.0 vs 37.7) dan matematika HMMT 2026 (96.2 vs 95.2). Dengan biaya vendor ~7× lebih rendah, V4 Pro adalah pilihan tepat ketika kualitas penalaran menjadi standar tetapi biaya tetap penting.

Apakah V4 Pro open-source?

Ya. Weights dipublikasikan di bawah MIT License. API DeepSeek yang dihosting adalah jalur produksi untuk VM0.

Alternatif

Menggunakan DeepSeek V4 Pro di VM0

Dua cara mengakses DeepSeek V4 Pro di VM0

VM0 mendukung DeepSeek V4 Pro sebagai model Built-in yang ditagih dalam kredit VM0, dan melalui bring-your-own dengan DeepSeek API key. Jalur Built-in menggunakan routing VM0 Managed dan pengali kredit yang dijelaskan di bawah; jalur bring-your-own menagih Anda langsung ke vendor hulu dan sepenuhnya melewati konversi kredit VM0.

Rekomendasi VM0

VM0 memposisikan DeepSeek V4 Pro sebagai opsi penghemat biaya alih-alih model agen inti. Gunakan untuk mengoptimalkan biaya satuan pada pekerjaan non-inti, seperti klasifikasi massal, pra-filter, balasan singkat yang kritis terhadap latensi, atau agen lawas yang di-pin, sambil tetap menjaga Claude Opus 4.7, Claude Opus 4.6, atau Claude Sonnet 4.6 pada langkah-langkah yang menentukan eksekusi.

Kredit dan pengali ×0.1

Setiap model Built-in di VM0 dihargai sebagai kelipatan dari Claude Sonnet 4.6, yang berada di baseline kredit ×1. DeepSeek V4 Pro ditagih pada ×0.1 kredit. Pengali inilah yang muncul di invoice VM0 Anda; harga daftar vendor di tabel harga di atas adalah yang dikenakan penyedia hulu sebelum VM0 mengonversinya menjadi kredit.

DeepSeek V4 Pro ditagih pada ×0.1, yang berarti satu langkah di sini berbiaya hanya 0.1× kredit dari langkah setara pada Sonnet 4.6 (baseline ×1). Itu menempatkannya jauh di bawah baseline kredit dan menjadikannya pilihan alami untuk pekerjaan latar belakang bervolume tinggi di mana biaya-per-langkah lebih penting daripada kualitas reasoning puncak.

Tersedia di VM0 sejak April 24, 2026.