VM0의 Kimi K2.7 Code. 롱컨텍스트 에이전트

Moonshot의 최신 오픈 웨이트 모델. 오픈소스 최전선에서 동급 최고의 에이전틱 벤치마크를 기록하며 Claude 호환 인터페이스를 제공합니다.

256K tokens · Text / Vision / Code · Prompt cache

Kimi K2.7 Code는 Moonshot의 오픈 웨이트 플래그십이며, 현재 여러 공개 벤치마크에서 가장 강력한 오픈소스 에이전틱 모델입니다. 흐름을 놓치지 않고 매우 긴 작업을 유지하며(Moonshot은 12시간 이상, 4,000회 이상의 도구 호출이 이루어진 무인 세션을 문서화했습니다), 이미지와 비디오 입력을 기본으로 지원합니다. 벤더가 보고한 SWE-bench Pro는 58.6에 달하며(해당 벤치마크에서 Claude Opus 4.6과 GPT-5.4를 상회), 환각 비율은 K2.6의 약 65%에서 약 39%로 떨어졌습니다.

벤더 정가는 100만 토큰당 $1.14 / $4.80이고, 오픈 웨이트는 Modified MIT 라이선스로 배포되며, API는 Anthropic 호환입니다. 프로덕션 도구 라우팅 신뢰성이 벤치마크 점수보다 중요할 때는 Sonnet 4.6을, 지연 시간이 가장 중요할 때는 Kimi K2.7 Code를 선택하세요.

Kimi K2.7 Code란?

2026년 6월 · Moonshot의 오픈 웨이트 Kimi K2 시리즈 최상위. K2.6 및 K2 Thinking의 후속 모델입니다.

Kimi K2.7 Code는 2026년 6월에 출시된 Moonshot AI의 오픈 웨이트 에이전틱 모델입니다. 토큰당 32B 활성 파라미터를 갖춘 1조 파라미터 Mixture-of-Experts(MoE) 모델입니다. K2.6 및 K2 Thinking과 동일한 아키텍처 계열로, 에이전틱 코딩과 장기 추론에서 상당한 향상을 이루었습니다.

K2.7은 독립 리더보드에서 큰 반향을 일으켰습니다. 벤더가 보고한 점수는 SWE-bench Pro에서 GPT-5.4(xhigh)와 Claude Opus 4.6(max effort)을 앞서며, 환각 비율은 39%(K2.6의 65%에서 하락)입니다. Artificial Analysis는 Intelligence Index에서 4위로 평가합니다. 선도적인 오픈 웨이트 옵션입니다.

VM0에서는 Moonshot API 키를 통해 기본 모델로 노출되며, 동일한 ×0.3 배수로 VM0 Managed를 통해서도 제공됩니다. API는 Anthropic 호환이므로 Claude용으로 작성된 VM0 에이전트가 코드 변경 없이 작동합니다.

Kimi K2.7 Code의 주목할 점

대표적인 아키텍처 및 기능 특징.

K2.7은 총 1T 파라미터, 토큰당 32B 활성 파라미터를 갖춘 Mixture-of-Experts 모델로, 256K 토큰 컨텍스트 윈도우와 이미지·비디오에 걸친 멀티모달 입력(텍스트 전용 출력)을 갖추고 있습니다. Moonshot은 이를 최대 300개의 서브 에이전트와 4,000회의 조율된 단계까지 수평 확장하는 Agent Swarm 런타임과 결합했으며, 12시간 이상의 장기 코딩 세션을 문서화했습니다. 오픈 웨이트는 Modified MIT License로 Hugging Face에 공개되어 있습니다.

한눈에 보는 사양

계열Kimi K2 시리즈

파라미터총 1T / 활성 32B (MoE)

모달리티이미지, 비디오, 텍스트

언어다국어

컨텍스트 윈도우256K 토큰

라이선스Modified MIT (오픈 웨이트)

VM0 제공 시점2026년 6월

Kimi K2.7 Code 벤치마크

Moonshot의 K2.7 출시 블로그에서 벤더가 보고한 점수입니다. 독립적인 제3자(Artificial Analysis, TokenMix)가 상대적 순위를 확인해 줍니다. K2.7의 환각 비율은 K2.6의 65%에서 39%로 떨어졌습니다. 상당한 안전성/신뢰성 개선입니다.

SWE-bench Pro벤더 보고; GPT-5.4, Opus 4.6을 상회

58.6

SWE-bench Verified벤더 보고

80.2

Terminal-Bench 2.0Terminus-2 프레임워크

66.7

LiveCodeBench (v6)벤더 보고

89.6

HLE (도구 포함)GPT-5.4와 Opus 4.6을 선도

54.0

BrowseComp (Agent Swarm)K2.6의 78.4에서 상승

86.3

Artificial Analysis Intelligence Index전체 4위, 선도적 오픈 웨이트

Kimi K2.7 Code 가격

공급사 정가, 100만 토큰당.

입력$1.14

출력$4.80

캐시 읽기$0.19

캐시 쓰기$1.14

Kimi K2.7 Code는 실제로 어떻게 작동하는가

프로덕션 에이전트 실행에서 관찰된 동작.

롱컨텍스트 회상

Built-in 라인업 전반에서 자체 내부 평가 기준 가장 강력한 롱컨텍스트 회상 능력을 보입니다. Anthropic Sonnet이 흐름을 놓치기 시작하는 긴 에이전트 트랜스크립트에서도 일관성을 유지합니다.

에이전틱 벤치마크

벤더가 보고한 SWE-bench Pro 58.6은 작성 시점 기준 라인업 내 최고치입니다. GPT-5.4와 Opus 4.6을 앞섭니다.

장기 코딩

12시간 이상의 자율 세션에서 4,000회 이상의 도구 호출을 완료한 사례가 문서화되어 있습니다. 이 모델은 매우 긴 작업 전반에 걸쳐 실제로 성능을 유지합니다.

도구 사용

일반적인 VM0 도구 흐름 전반에서 안정적입니다. Anthropic 호환 API 덕분에 Claude용으로 설계된 도구 스키마가 그대로 작동합니다.

Kimi K2.7 Code에 가장 적합한 에이전트 작업

모든 오래된 스레드를 읽어야 하는 조사

6개월치 Slack 대화를 뒤져 고객이 이탈한 이유를 찾거나, 지원 티켓 백로그를 샅샅이 훑어 반복되는 버그 패턴을 찾거나, 수백 개의 RFC에서 인사이트를 엮어내는 작업입니다. K2.7의 롱컨텍스트 회상은 Anthropic Sonnet이 앞부분 턴을 떨어뜨리기 시작하는 트랜스크립트에서도 버텨내는데, 이것이 바로 "전체 더미를 읽는" 워크플로에 필요한 능력입니다.

밤새 실행되는 자율 리팩터링

Moonshot은 8년 된 매칭 엔진을 13시간 동안 자율 리팩터링하면서 K2.7이 작업 흐름을 벗어나지 않고 4,000회 이상의 도구 호출을 유지한 사례를 문서화했습니다. 대부분의 모델은 두 시간쯤 지나면 목표를 잃어버리는 종류의 작업입니다. K2.7의 장기 안정성 덕분에 "금요일 저녁에 시작하고 월요일 아침에 확인하기"가 실제로 가능해집니다.

스크린샷과 클립을 처리하는 멀티모달 에이전트

K2.7은 MoonViT를 통해 이미지와 비디오 입력을 모두 받아들이는데, 이는 Claude 계열 밖에서는 드문 일입니다. 스크린샷 기반 QA 에이전트, 문서 비전 파이프라인, 그리고 이미지를 읽기 위해 별도의 비전 모델을 끼워 넣어야 했을 모든 배포에 유용합니다.

Kimi K2.7 Code를 건너뛰어야 할 때

Sonnet 4.6이 여전히 프로덕션 신뢰성에서 앞서는 가장 까다로운 도구 라우팅 엣지 케이스에서는, 그리고 K2.6의 더 낮은 배수로 이미 충분한 고정된 레거시 워크플로에서는 K2.7을 건너뛰세요.

Kimi K2.7 Code vs 다른 모델

Kimi K2.7 Code vs GLM-5.2

둘 다 현재 비용을 절감하는 롱컨텍스트 옵션입니다. K2.7 Code는 멀티모달 코딩 적합성이 더 강한 Moonshot 기본값이고, GLM-5.2는 1M 토큰의 더 큰 컨텍스트 윈도우를 갖춘 현재 Z.AI 기본값입니다.

Kimi K2.7 Code vs Claude Sonnet 4.6

Sonnet(×1)은 다중 도구 영어 라우팅 신뢰성에서 앞섭니다. K2.7(×0.3)은 비용과 에이전틱 벤치마크(SWE-bench Pro)에서 우위에 있습니다. 둘을 함께 쓰세요. 복잡한 도구 라우팅에는 Sonnet, 비용에 민감한 에이전트 작업에는 K2.7.

Kimi K2.7 Code vs DeepSeek V4 Pro

DeepSeek V4 Pro는 더 저렴하고 1M 토큰의 더 큰 컨텍스트 윈도우를 갖추고 있습니다. Kimi K2.7 Code는 더 강력한 Moonshot 네이티브 코딩 경로이며 비전 입력을 포함합니다. 프로바이더 적합성과 워크로드 형태에 따라 선택하세요.

결론: Kimi K2.7 Code를 사용해야 할까?

진지한 에이전트 작업을 위한 오픈 웨이트 기본값 — 롱컨텍스트, 비용 효율적. Sonnet 4.6 대비 남아 있는 격차는 도구 라우팅 신뢰성과 엔터프라이즈 지원입니다.

자주 묻는 질문

Kimi K2.7 Code는 언제 출시되었나요?

Moonshot AI는 2026년 6월에 Kimi K2.7 Code를 출시했습니다. 오픈 웨이트는 Modified MIT License로 Hugging Face에 공개되어 있습니다.

컨텍스트 윈도우는 어떻게 되나요?

256K 토큰입니다. K2.7은 원시 윈도우 크기가 아니라 그 크기에서의 회상 품질로 차별화됩니다. 회상은 약 180K를 넘어서면 저하되기 시작합니다(다른 256K 모델과 유사).

Kimi를 사용하려면 에이전트를 다시 작성해야 하나요?

아니요. Kimi K2.7 Code는 Anthropic 호환 API를 노출하므로 Claude에 맞춰 튜닝된 VM0 에이전트가 코드 변경 없이 작동합니다.

Kimi K2.7 Code는 Claude Opus 4.6과 비교하면 어떤가요?

에이전틱 벤치마크(벤더 보고)에서는 K2.7이 앞섭니다. SWE-bench Pro 58.6 대 Opus 4.6의 53.4, 도구 포함 HLE 54.0 대 53.0. Opus 4.6은 안전성 프로필과 프로덕션에서의 영어 도구 라우팅 신뢰성에서 우위를 유지합니다.

K2.7은 이미지 입력을 지원하나요?

예. K2.7은 이미지와 비디오 입력을 받아들입니다. 출력은 텍스트 전용입니다. 멀티모달 에이전트가 기본으로 작동합니다.

대안

GLM-5.2

현재 Z.AI 롱컨텍스트 경로

DeepSeek V4 Pro

비용에 민감한 작업을 위한 더 저렴한 추론 대안

Claude Sonnet 4.6

복잡한 도구 사용을 위한 더 높은 신뢰성의 기준선

VM0에서 Kimi K2.7 Code 사용하기

VM0에서 Kimi K2.7 Code에 접근하는 두 가지 방법

VM0는 Kimi K2.7 Code를 VM0 크레딧으로 과금되는 Built-in 모델로 지원하며, Moonshot API key를 사용하는 BYO(직접 키 사용) 방식으로도 지원합니다. Built-in 경로는 VM0 Managed 라우팅과 아래에서 설명하는 크레딧 배수를 사용하고, BYO 경로는 상위 공급사가 직접 과금하며 VM0 크레딧 변환을 완전히 건너뜁니다.

VM0의 추천

VM0는 Kimi K2.7 Code를 핵심 에이전트 모델이 아닌 비용 절감 옵션으로 자리매김합니다. 대량 분류, 사전 필터링, 지연 시간이 중요한 짧은 응답, 또는 고정된 레거시 에이전트 같은 비핵심 작업의 단위 비용을 최적화하는 데 사용하고, 실행을 결정하는 단계에는 Claude Opus 4.7, Claude Opus 4.6, 또는 Claude Sonnet 4.6를 유지하세요.

크레딧과 ×0.3 배수

VM0의 모든 Built-in 모델은 ×1 크레딧 기준점에 위치한 Claude Sonnet 4.6의 배수로 가격이 책정됩니다. Kimi K2.7 Code는 ×0.3 크레딧으로 과금됩니다. 이 배수는 VM0 청구서에 표시되는 값이며, 위 가격표의 공급사 정가는 VM0가 이를 크레딧으로 변환하기 전에 상위 공급사가 부과하는 금액입니다.

Kimi K2.7 Code는 ×0.3로 과금되며, 이는 여기서의 한 단계가 Sonnet 4.6(×1 기준점)에서의 동일한 단계 대비 0.3배의 크레딧만 든다는 뜻입니다. 이는 크레딧 기준점을 크게 밑돌며, 단계당 비용이 최고 수준의 추론 품질보다 더 중요한 대량 백그라운드 작업에 자연스러운 선택지가 됩니다.

June 2026부터 VM0에서 사용 가능.