VM0의 DeepSeek V4 Pro. 비용 최적화 추론

DeepSeek의 플래그십 V4 추론 모델. 벤더 비용의 7분의 1로 SWE-bench Verified에서 Claude Opus 4.6과 0.2점 이내. Claude 호환 API.

1M tokens · Text / Code · Prompt cache

DeepSeek V4 Pro는 DeepSeek V4 세대의 플래그십으로, MIT 라이선스로 배포된 오픈 웨이트 1.6T 파라미터 MoE입니다. 핵심은 가격 대비 품질 비율입니다. 벤더가 보고한 SWE-bench Verified는 80.6%로 Claude Opus 4.6과 1점 미만 차이이며, Anthropic 벤더 비용의 약 7분의 1입니다. 덕분에 추론 집약적 에이전트 — 대량 PR 리뷰, 일괄 문서 분석, 예약 요약 — 를 대용량으로 감당할 수 있게 됩니다.

벤더 정가는 100만 토큰당 $1.74 / $3.48이며, 캐시 읽기는 100만 토큰당 $0.028, 캐시 쓰기는 무료입니다(라인업에서 유일). 1M 토큰 컨텍스트, Anthropic 호환 API. 프로덕션 도구 라우팅 신뢰성이 결정적 요인일 때는 Sonnet 4.6을, 단발성 대량 작업이 V4 Pro의 추론 깊이를 필요로 하지 않을 때는 GPT-5.4 Mini나 Kimi K2.7 Code를 선택하세요.

DeepSeek V4 Pro란?

2026년 4월 24일 · DeepSeek V4 계열의 추론 변형으로, 최대 추론 품질에 중점을 둡니다.

DeepSeek V4 Pro는 2026년 4월 24일 MIT License로 출시된 DeepSeek V4 세대의 플래그십입니다. 총 1.6T 파라미터, 토큰당 49B 활성 파라미터를 갖춘 오픈 웨이트 Mixture-of-Experts 모델입니다.

V4 Pro는 1M 토큰 컨텍스트 윈도우, 최대 384K 출력, 세 가지 추론 강도 모드(standard, think, think-max), JSON 출력, 도구 호출, 그리고 non-think 모드에서의 FIM 완성을 지원합니다. Pro 모델은 롱컨텍스트 효율을 크게 개선하기 위한 하이브리드 어텐션 아키텍처(Compressed Sparse Attention + Heavily Compressed Attention)를 추가합니다. 1M 컨텍스트에서 DeepSeek V3.2 대비 단일 토큰 추론 FLOPs의 27%, KV 캐시의 10%입니다.

DeepSeek는 2025년 내내 Anthropic급 추론을 가격의 일부로 제공하며 화제를 일으켰습니다. V4 Pro는 그 패턴을 이어갑니다. 벤더가 보고한 SWE-bench Verified 80.6%는 Claude Opus 4.6과 0.2점 이내에 있으며, 벤더 비용은 약 7분의 1입니다. VM0에서는 DeepSeek API 키 프로바이더를 통해, 그리고 VM0 Managed에서 ×0.1로 노출됩니다. Kimi K2.7 Code보다 낮은 배수이면서 추론 행동은 상당히 더 강력합니다.

DeepSeek V4 Pro의 주목할 점

대표적인 아키텍처 및 기능 특징.

V4 Pro는 총 1.6T 파라미터, 토큰당 49B 활성 파라미터를 갖춘 Mixture-of-Experts 모델로, 롱컨텍스트 추론 비용을 낮게 유지하는 하이브리드 어텐션 스택(Compressed Sparse Attention 및 Heavily Compressed Attention)을 갖추고 있습니다. 1M 토큰 컨텍스트 윈도우와 384K 최대 출력을 지원하고, 세 가지 추론 강도 모드(standard, think, think-max)를 제공하며, 안정적인 신호 전파를 위해 Manifold-Constrained Hyper-Connections를 사용합니다. 모델은 Muon 옵티마이저로 32T 이상의 토큰으로 학습되었으며 오픈 웨이트와 함께 MIT License로 배포됩니다.

한눈에 보는 사양

계열DeepSeek V4 시리즈

파라미터총 1.6T / 활성 49B (MoE)

모달리티텍스트, 코드

언어다국어

컨텍스트 윈도우1M 토큰

최대 출력384K 토큰

라이선스MIT (오픈 웨이트)

VM0 제공 시점2026년 4월 24일

DeepSeek V4 Pro 벤치마크

DeepSeek의 V4 Pro 출시에서 벤더가 보고한 점수입니다. 독립 리뷰(Geeky Gadgets, Code Arena)는 V4 Pro를 GLM-5.1과 Kimi K2.7 Code에 이어 Code Arena 3위로 놓습니다. 가장 강력한 벤치마크 주장은 DeepSeek 자체 자료에서 나온 것입니다. 절대적 사실이 아니라 방향성으로 받아들이세요.

SWE-bench Verified벤더 보고; Opus 4.6과 0.2점 이내

80.6%

Terminal-Bench 2.0벤더 보고; Opus 4.6을 선도

67.9%

LiveCodeBench벤더 보고

93.5%

Codeforces rating벤더 보고

3206

MMLU-Pro벤더 보고

GPT-5.4와 동등

Artificial Analysis Intelligence Indexmax effort

속도Artificial Analysis

초당 약 36 토큰

DeepSeek V4 Pro 가격

공급사 정가, 100만 토큰당.

입력$1.74

출력$3.48

캐시 읽기$0.14

캐시 쓰기과금되지 않음

DeepSeek V4 Pro는 실제로 어떻게 작동하는가

프로덕션 에이전트 실행에서 관찰된 동작.

추론

라인업에서 가장 강력한 sub-Sonnet 추론. 더 저렴한 모델이 흐름을 놓치기 시작하는 다단계 작업에서도 버텨냅니다. 벤더가 보고한 MMLU-Pro는 GPT-5.4와 동등합니다.

코딩 벤치마크

벤더 보고 SWE-bench Verified 80.6%(Opus 4.6과 0.2 이내), Terminal-Bench 2.0 67.9%(Opus 4.6을 선도), LiveCodeBench 93.5%.

비용 효율

가장 두드러진 특성입니다. ×0.1 크레딧 비용에 Sonnet 4.6과 잘 경쟁하는 추론을 갖춘 V4 Pro는 비용 최적화 기본값이며, Claude Opus 4.7보다 훨씬 저렴합니다.

캐시 경제성

캐시 쓰기가 무료입니다. VM0의 Built-in 모델 중 유일합니다. 안정적인 시스템 프롬프트와 큰 붙여넣기 참조 문서를 캐시하는 데 추가 비용이 들지 않으며, 읽기 측에만 과금됩니다.

속도

Artificial Analysis 기준 max effort에서 초당 약 36 토큰. Kimi K2.7 Code보다 느리고, Opus 4.6보다 약간 느립니다.

DeepSeek V4 Pro에 가장 적합한 에이전트 작업

모든 커밋에서 실행되는 PR 리뷰 에이전트

Sonnet 벤더 비용의 일부로 Sonnet급 정확도를 얻을 수 있다는 점이 "큰 PR뿐 아니라 모든 커밋을 리뷰하기"를 실제로 가능하게 만듭니다. V4 Pro는 diff, 관련 파일, 연결된 이슈를 읽고 구조화된 코멘트를 작성하며, 호출당 가격이 충분히 낮아 모든 푸시마다 CI 단계로 실행해도 눈에 띄는 비용 항목으로 나타나지 않습니다.

매일 밤 실행되는 예약 요약기

어제의 고객 대화, 지원 티켓, 또는 영업 통화를 끌어와 다이제스트를 작성합니다. 시스템 프롬프트와 도구 스키마는 실행 사이에 바뀌지 않고, DeepSeek는 캐시 쓰기에 과금하지 않으므로, 긴 고정 접두부는 한 번만 지불되고 캐시 읽기는 일반 입력의 일부 비용에 불과합니다. 바로 여기서 V4 Pro의 가격 모델이 감당 가능한 범위를 실질적으로 바꿉니다.

Opus보다 저렴한 전체 리포 코드 에이전트

하이브리드 어텐션(Compressed Sparse Attention 및 Heavily Compressed Attention)을 갖춘 1M 토큰 컨텍스트 덕분에 중간 규모 코드베이스가 하나의 프롬프트에 들어가고, 윈도우가 채워지더라도 추론 비용이 관리 가능한 수준으로 유지됩니다. 파일 간 리팩터링과 아키텍처 수준 리뷰에서, Opus식 청구서 없이 Opus식 "한 번에 전체 보기" 워크플로를 얻을 수 있습니다.

DeepSeek V4 Pro를 건너뛰어야 할 때

Sonnet 4.6이 여전히 앞서는 가장 까다로운 도구 라우팅 엣지 케이스에서는, 그리고 GPT-5.4 Mini나 Kimi K2.7 Code로 더 낮은 비용에 충분한 대량 단발성 작업에서는 V4 Pro를 건너뛰세요.

DeepSeek V4 Pro vs 다른 모델

DeepSeek V4 Pro vs Claude Sonnet 4.6

Sonnet 4.6(×1)은 도구 라우팅 엣지 케이스와 영어 추론에서 앞섭니다. V4 Pro(×0.1)는 비용에서 앞서고 코딩 벤치마크(벤더 보고)에서 경쟁력이 있습니다. 결정하기 전에 실제 에이전트에서 A/B 테스트할 만합니다.

DeepSeek V4 Pro vs Kimi K2.7 Code

Kimi보다 낮은 배수입니다(×0.1 대 ×0.3). Kimi는 더 강력한 롱컨텍스트 회상과 더 높은 Intelligence Index(54 대 52)를 가지고 있고, V4 Pro는 더 나은 캐시 경제성(쓰기 무료)과 Kimi의 256K 대비 1M 컨텍스트 윈도우를 가지고 있습니다. 어느 특성이 더 중요한지에 따라 선택하세요.

DeepSeek V4 Pro vs GLM-5.2

GLM-5.2는 VM0에서 현재 Z.AI 기본 경로입니다. 새로운 Z.AI 기반 에이전트에 대한 더 나은 비교 대상이며, GLM-5.1은 튜닝된 워크플로 호환성을 위해서만 계속 제공됩니다.

결론: DeepSeek V4 Pro를 사용해야 할까?

GPT-5.4 Mini나 Kimi K2.7 Code로 사전 필터링하고, 추론을 위해 V4 Pro로 에스컬레이션하며, V4 Pro가 도구 라우팅 엣지 케이스에서 막힐 때만 Sonnet 4.6으로 에스컬레이션하세요.

자주 묻는 질문

DeepSeek V4 Pro는 언제 출시되었나요?

DeepSeek는 2026년 4월 24일 오픈 웨이트와 함께 MIT License로 V4 Pro를 출시했습니다.

캐시 쓰기가 왜 무료인가요?

DeepSeek는 캐시 쓰기 부분에 과금하지 않습니다. 캐시 읽기만 100만 토큰당 $0.145로 과금됩니다. 안정적인 시스템 프롬프트와 큰 참조 컨텍스트를 캐시하는 데 추가 비용이 들지 않습니다.

V4 Pro의 컨텍스트 윈도우는 어떻게 되나요?

100만 토큰이며 최대 384K 토큰의 출력을 제공합니다. 하이브리드 어텐션 아키텍처 덕분에 V3.2보다 훨씬 낮은 추론 비용으로 전체 윈도우를 사용할 수 있습니다.

V4 Pro는 Claude Opus 4.6과 비교하면 어떤가요?

벤더가 보고한 SWE-bench Verified는 0.2점 이내입니다(80.6 대 80.8). Terminal-Bench 2.0은 V4 Pro에 유리합니다(67.9 대 65.4). Opus 4.6은 HLE(40.0 대 37.7)와 HMMT 2026 수학(96.2 대 95.2)에서 앞섭니다. 약 7배 낮은 벤더 비용으로, 추론 품질이 기준이지만 비용이 중요할 때 V4 Pro가 적절한 선택입니다.

V4 Pro는 오픈소스인가요?

예. 웨이트가 MIT License로 공개되어 있습니다. 호스팅되는 DeepSeek API가 VM0의 프로덕션 경로입니다.

대안

Claude Sonnet 4.6

어려운 도구 라우팅을 위한 한 단계 상위

Kimi K2.7 Code

멀티모달 코딩 적합성이 더 강한 Moonshot 기본값

VM0에서 DeepSeek V4 Pro 사용하기

VM0에서 DeepSeek V4 Pro에 접근하는 두 가지 방법

VM0는 DeepSeek V4 Pro를 VM0 크레딧으로 과금되는 Built-in 모델로 지원하며, DeepSeek API key를 사용하는 BYO(직접 키 사용) 방식으로도 지원합니다. Built-in 경로는 VM0 Managed 라우팅과 아래에서 설명하는 크레딧 배수를 사용하고, BYO 경로는 상위 공급사가 직접 과금하며 VM0 크레딧 변환을 완전히 건너뜁니다.

VM0의 추천

VM0는 DeepSeek V4 Pro를 핵심 에이전트 모델이 아닌 비용 절감 옵션으로 자리매김합니다. 대량 분류, 사전 필터링, 지연 시간이 중요한 짧은 응답, 또는 고정된 레거시 에이전트 같은 비핵심 작업의 단위 비용을 최적화하는 데 사용하고, 실행을 결정하는 단계에는 Claude Opus 4.7, Claude Opus 4.6, 또는 Claude Sonnet 4.6를 유지하세요.

크레딧과 ×0.1 배수

VM0의 모든 Built-in 모델은 ×1 크레딧 기준점에 위치한 Claude Sonnet 4.6의 배수로 가격이 책정됩니다. DeepSeek V4 Pro는 ×0.1 크레딧으로 과금됩니다. 이 배수는 VM0 청구서에 표시되는 값이며, 위 가격표의 공급사 정가는 VM0가 이를 크레딧으로 변환하기 전에 상위 공급사가 부과하는 금액입니다.

DeepSeek V4 Pro는 ×0.1로 과금되며, 이는 여기서의 한 단계가 Sonnet 4.6(×1 기준점)에서의 동일한 단계 대비 0.1배의 크레딧만 든다는 뜻입니다. 이는 크레딧 기준점을 크게 밑돌며, 단계당 비용이 최고 수준의 추론 품질보다 더 중요한 대량 백그라운드 작업에 자연스러운 선택지가 됩니다.

April 24, 2026부터 VM0에서 사용 가능.