GPT-5.4 Mini di VM0. GPT-5 yang hemat biaya

Anggota keluarga GPT-5 OpenAI yang dioptimalkan untuk biaya. Kredit ×0,3, visi multimodal, dan cukup cepat untuk routing, klasifikasi, serta pekerjaan prapenyaringan bervolume tinggi.

400K tokens · Text / Vision / Code · Prompt cache

Gunakan GPT-5.4 Mini di VM0

GPT-5.4 Mini adalah anggota hemat biaya keluarga GPT-5 OpenAI — yang Anda pilih ketika biaya per unit lebih penting daripada kualitas penalaran puncak. Ia mempertahankan jendela konteks 400K dan input multimodal dari anggota keluarga lainnya tetapi memangkas komputasi per token, yang berarti harga lebih rendah ($0,75 / $4,5 per 1M) dan kecepatan yang jauh lebih tinggi.

Di VM0 model ini berada pada kredit ×0,3, multiplier yang sama dengan Kimi K2.7 Code, yang membuatnya menjadi pilihan alami di sisi OpenAI untuk klasifikasi massal, routing fan-out, prapenyaringan, dan langkah agen apa pun di mana turun ke sepertiga biaya GPT-5.4 menjadi faktor penentu.

Apa itu GPT-5.4 Mini?

April 2026 · Varian hemat biaya keluarga GPT-5. Setara di sisi OpenAI dari Kimi K2.7 Code.

GPT-5.4 Mini adalah anggota generasi GPT-5 OpenAI yang dioptimalkan untuk biaya, dirilis pada April 2026 bersama GPT-5.5 dan GPT-5.4. OpenAI memosisikannya sebagai tingkat throughput tinggi — model yang Anda jalankan pada langkah klasifikasi, routing, dan prapenyaringan di mana 5.4 atau 5.5 yang lebih besar akan terbuang sia-sia pada keputusan rutin.

Secara arsitektur ia berbagi jendela konteks 400K token keluarga GPT-5, parameter reasoning_effort, prompt caching, dan permukaan Responses API yang digunakan codex CLI secara default. Imbal baliknya dibandingkan 5.4 adalah kedalaman penalaran: Mini menangani pemanggilan tool standar, ringkasan pendek, dan beban kerja structured-output dengan baik, tetapi mulai melenceng pada rencana multi-langkah yang lebih sulit di mana 5.4 masih bertahan. Imbal baliknya dibandingkan pesaing pada titik harga yang sama adalah ekosistem — jika Anda sudah memakai Codex, tetap berada di dalam permukaan OpenAI menjaga definisi tool dan skema structured-output tetap konsisten.

Di VM0 Mini berada pada multiplier kredit ×0,3, sama seperti Kimi K2.7 Code. DeepSeek V4 Pro berada lebih rendah pada ×0,1, jadi di dalam tingkat hemat biaya, pilihan kebanyakan bergantung pada framework dan kecocokan perilaku pada beban kerja spesifik Anda.

Apa yang menonjol dari GPT-5.4 Mini

Fitur arsitektur dan kapabilitas utama.

GPT-5.4 Mini menggunakan arsitektur yang sama dengan seluruh keluarga GPT-5: jendela konteks 400K token, parameter reasoning_effort di empat tingkat, prompt caching di mana input yang di-cache ditagih sepersepuluh dari tarif input, serta permukaan Responses API. Penggunaan tool, structured outputs, dan input visi multimodal didukung. Model ini adalah saudara yang lebih kecil dan lebih cepat — lebih sedikit parameter per token, lebih banyak throughput per dolar.

Spesifikasi sekilas

KeluargaGenerasi GPT-5

ModalitasTeks, visi, kode

BahasaMengutamakan Inggris, multibahasa

Prompt cachingDidukung (OpenAI)

Jendela konteks400K token

Output maksimumHingga 128K token

Upaya penalaranMinimal / Rendah / Sedang / Tinggi

Harga daftar vendor$0,75 input / $4,5 output per 1M

Benchmark GPT-5.4 Mini

Skor yang dilaporkan vendor dari materi rilis GPT-5 Mini OpenAI. Ulasan independen menempatkan 5.4 Mini di pita hemat biaya yang sama dengan Kimi K2.7 Code pada sebagian besar benchmark agen. Perlakukan persentase absolut sebagai indikasi arah.

SWE-bench Verifieddilaporkan vendor

~60%

Terminal-Bench 2.0penggunaan tool dilaporkan vendor

~42%

AIME 2025 (tanpa tool)matematika kompetisi dilaporkan vendor

~84%

GPQA Diamondsains pascasarjana dilaporkan vendor

~74%

KecepatanArtificial Analysis, upaya sedang

~165 token/dtk

Harga GPT-5.4 Mini

Harga daftar vendor, per 1J token.

Input$0.75

Output$4.50

Cache read$0.07

Cache writeTidak ditagih

Bagaimana GPT-5.4 Mini berperilaku dalam praktik

Perilaku yang diamati dari eksekusi agen produksi.

Kecepatan

Model tercepat di keluarga GPT-5 — sekitar 165 token/dtk pada upaya sedang menurut Artificial Analysis. Inilah properti yang membuatnya layak untuk balasan chat interaktif dan pemanggilan tool fan-out pendek di mana latensi yang terlihat pengguna mendominasi.

Pemanggilan tool rutin

Akurat pada katalog tool framework Codex standar. Tempat 5.4 unggul adalah pada kasus edge yang sulit (pemilihan tool bersyarat, argumen yang sangat bertingkat) — untuk kasus rutin, Mini menangani tool routing dengan bersih pada sepertiga biaya.

Klasifikasi massal & prapenyaringan

Posisi biaya/kualitas terkuat di keluarga GPT-5 untuk pekerjaan fan-out. Triase PR massal, kategorisasi tiket dukungan, klasifikasi tingkat dokumen — semua beban kerja yang sebelumnya Anda kerjakan dengan regex buatan tangan kini terjangkau dalam pemanggilan model sungguhan.

Efisiensi biaya

Kredit ×0,3 dengan visi multimodal disertakan. Mini dan Kimi K2.7 Code berada di pita yang sama, sementara DeepSeek V4 Pro berada lebih rendah pada ×0,1 — pilihannya biasanya bergantung pada kecocokan framework dan perilaku pada beban kerja spesifik Anda.

Kapan harus mengeskalasi

Mini melenceng pada rencana multi-langkah yang panjang, penalaran sulit, dan penyuntingan kode multi-file percobaan pertama. Bangun agen sedemikian rupa sehingga orkestrator yang memutuskan kapan harus mengeskalasi ke 5.4 atau 5.5, bukan agar Mini mencoba memikul seluruh loop.

Tugas agen terbaik untuk GPT-5.4 Mini

Klasifikasi fan-out yang berjalan pada setiap event

Tiket dukungan masuk, komentar PR, transkrip panggilan penjualan, unggahan dokumen — Mini membaca masing-masing dan mengarahkannya ke agen hilir atau peninjau manusia yang tepat. Kredit ×0,3 dan 165 token/dtk berarti biaya per event cukup kecil sehingga menjalankannya pada setiap event (bukan hanya batch sampel) benar-benar layak.

Langkah prapenyaringan sebelum model mahal

Sematkan Mini di puncak pemanggilan tool agen sehingga ia memutuskan apakah permintaannya bahkan perlu dieskalasi. Sebagian besar permintaan mendapat jawaban cepat dan murah; hanya minoritas sisa yang membayar penuh biaya GPT-5.4 atau 5.5. Di sinilah menumpuk tingkat hemat biaya dan inti benar-benar mengubah apa yang terjangkau.

Balasan chat interaktif

Giliran multimodal pendek di mana latensi yang terlihat pengguna mendominasi pengalaman. Mini menjawab cukup cepat sehingga streaming terasa instan, dan dukungan multimodal berarti tangkapan layar dalam percakapan langsung berfungsi tanpa repot.

Kapan melewatkan GPT-5.4 Mini

Lewati GPT-5.4 Mini pada penalaran tersulit, orkestrasi agen multi-langkah, urutan computer-use, dan penyuntingan kode multi-file percobaan pertama — eskalasikan ke 5.4 untuk versi rutin tugas-tugas itu dan ke 5.5 untuk yang tersulit.

GPT-5.4 Mini vs model lain

GPT-5.4 Mini vs GPT-5.4

Keluarga yang sama, pemosisian berbeda. 5.4 Mini (×0,3) menang pada biaya dan kecepatan; 5.4 (×1) menang pada kualitas penalaran dan akurasi tool-routing pada kasus sulit. Pola standarnya adalah prapenyaringan dengan Mini dan mengeskalasi kasus sisa ke 5.4.

GPT-5.4 Mini vs Claude Sonnet 4.6

Claude Sonnet 4.6 adalah target perbandingan katalog saat ini untuk model ini.

GPT-5.4 Mini vs DeepSeek V4 Pro

DeepSeek V4 Pro berada lebih rendah pada kredit VM0 dan menjadi pilihan penalaran yang mengutamakan biaya lebih kuat. Gunakan ketika harga menjadi penentu, dan gunakan model saat ini ketika kecocokan provider atau profil tool-routing-nya lebih penting.

Kesimpulan: haruskah Anda menggunakan GPT-5.4 Mini?

GPT-5.4 Mini adalah default hemat biaya di sisi OpenAI. Prapenyaringan dengan Mini, eskalasikan ke GPT-5.4 untuk langkah rutin, eskalasikan ke GPT-5.5 hanya untuk penalaran tersulit.

Pertanyaan yang sering diajukan

Berapa jendela konteks GPT-5.4 Mini?

400.000 token, dengan output hingga 128K token per respons — sama seperti seluruh keluarga GPT-5.

Bisakah GPT-5.4 Mini menangani gambar?

Ya. Seperti seluruh keluarga GPT-5, ia menerima input gambar bersama teks dan kode.

Kapan saya harus memilih GPT-5.4 Mini alih-alih Kimi K2.7 Code?

Ketika agen Anda sudah dibangun di framework Codex atau Anda membutuhkan ekosistem structured-output / tool-call OpenAI. Keduanya berada pada kredit ×0,3, jadi biayanya identik dan pilihannya bergantung pada framework dan perilaku.

Apakah GPT-5.4 Mini mendukung prompt caching?

Ya. Input yang di-cache ditagih $0,075 per 1M token — diskon 10× pada bagian yang di-cache.

Framework apa yang digunakan GPT-5.4 Mini di VM0?

Codex. VM0 mengarahkan semua model GPT-5 melalui permukaan Responses API framework Codex.

Alternatif

GPT-5.4

Naik untuk langkah yang lebih sulit, keluarga yang sama

Menggunakan GPT-5.4 Mini di VM0

Dua cara mengakses GPT-5.4 Mini di VM0

VM0 mendukung GPT-5.4 Mini sebagai model Built-in yang ditagih dalam kredit VM0, dan melalui bring-your-own dengan OpenAI API key. Jalur Built-in menggunakan routing VM0 Managed dan pengali kredit yang dijelaskan di bawah; jalur bring-your-own menagih Anda langsung ke vendor hulu dan sepenuhnya melewati konversi kredit VM0.

Rekomendasi VM0

VM0 memposisikan GPT-5.4 Mini sebagai opsi penghemat biaya alih-alih model agen inti. Gunakan untuk mengoptimalkan biaya satuan pada pekerjaan non-inti, seperti klasifikasi massal, pra-filter, balasan singkat yang kritis terhadap latensi, atau agen lawas yang di-pin, sambil tetap menjaga Claude Opus 4.7, Claude Opus 4.6, atau Claude Sonnet 4.6 pada langkah-langkah yang menentukan eksekusi.

Kredit dan pengali ×0.3

Setiap model Built-in di VM0 dihargai sebagai kelipatan dari Claude Sonnet 4.6, yang berada di baseline kredit ×1. GPT-5.4 Mini ditagih pada ×0.3 kredit. Pengali inilah yang muncul di invoice VM0 Anda; harga daftar vendor di tabel harga di atas adalah yang dikenakan penyedia hulu sebelum VM0 mengonversinya menjadi kredit.

GPT-5.4 Mini ditagih pada ×0.3, yang berarti satu langkah di sini berbiaya hanya 0.3× kredit dari langkah setara pada Sonnet 4.6 (baseline ×1). Itu menempatkannya jauh di bawah baseline kredit dan menjadikannya pilihan alami untuk pekerjaan latar belakang bervolume tinggi di mana biaya-per-langkah lebih penting daripada kualitas reasoning puncak.

Tersedia di VM0 sejak April 2026.