Kimi K2.6 on VM0. 長文コンテキストエージェント

Moonshotの最新オープンウェイトモデル。オープンソース最前線で最高クラスのエージェントベンチマーク、Claude互換インターフェース。

256K tokens · Text / Vision / Code · Prompt cache

Kimi K2.6はMoonshotのオープンウェイトフラッグシップであり、複数の公開ベンチマークで現在最強のオープンソースエージェントモデルです。非常に長い実行でもスレッドを見失わず（Moonshotは12時間以上・4,000回以上のツール呼び出しの無人のセッションを文書化）、画像と動画の入力をネイティブに受け付けます。ベンダー報告のSWE-bench Proは58.6（当該ベンチマークでClaude Opus 4.6とGPT-5.4を上回る）で、ハルシネーション率はK2.5の約65%から約39%に低下しました。

ベンダー価格は$0.60/$3/1Mトークン、オープンウェイトはModified MITライセンスで公開、APIはAnthropic互換です。プロダクションのツールルーティング信頼性がベンチマークスコアより重要な場合はSonnet 4.6を、レイテンシが支配的な場合はHaikuを選びましょう。

Kimi K2.6とは？

2026年4月20日 · MoonshotのオープンウェイトKimi K2シリーズの最上位。K2.5とK2 Thinkingの後継。

Kimi K2.6は2026年4月20日にリリースされたMoonshot AIのオープンウェイトエージェントモデルです。1兆パラメータのMixture-of-Experts（MoE）モデルで、トークンあたり32Bのアクティブパラメータを持ちます。K2.5およびK2 Thinkingと同じアーキテクチャファミリーで、エージェントコーディングと長期的推論において大幅な向上を達成しています。

K2.6は独立したリーダーボードで大きな話題を呼びました。ベンダー報告のスコアはSWE-bench ProでGPT-5.4（xhigh）とClaude Opus 4.6（max effort）を上回り、ハルシネーション率は39%（K2.5の65%から低下）です。Artificial AnalysisのIntelligence Indexで#4にランクイン。オープンウェイトのトップ選択肢です。

VM0ではMoonshot APIキー経由でデフォルトモデルとして、VM0 Managed経由で同じ×0.3マルチプライヤーで、さらにOpenRouter経由でも利用可能です。APIはAnthropic互換のため、Claude向けに作成されたVM0エージェントはコード変更なしで動作します。

Kimi K2.6の注目ポイント

アーキテクチャと機能の主な特徴。

K2.6は1T総パラメータ・32Bアクティブ/トークンのMixture-of-Expertsモデルで、256Kトークンのコンテキストウィンドウと画像・動画入力（テキスト出力のみ）に対応します。MoonshotはこれをAgent Swarmランタイムと組み合わせており、300のサブエージェントと4,000の調整ステップに水平スケーリングし、12時間以上の長期的コーディングセッションを文書化しています。オープンウェイトはModified MITライセンスでHugging Faceに公開されています。

スペック概要

ファミリーKimi K2シリーズ

パラメータ1T総/32Bアクティブ（MoE）

モダリティ画像、動画、テキスト

言語多言語

コンテキストウィンドウ256Kトークン

ライセンスModified MIT（オープンウェイト）

VM0での利用開始2026年4月

Kimi K2.6のベンチマーク

MoonshotのK2.6リリースブログからのベンダー報告スコア。独立した第三者（Artificial Analysis、TokenMix）が相対的な順位を裏付けています。K2.6のハルシネーション率はK2.5の65%から39%に低下。安全性/信頼性の大幅な改善です。

SWE-bench Proベンダー報告；GPT-5.4、Opus 4.6を上回る

58.6

SWE-bench Verifiedベンダー報告

80.2

Terminal-Bench 2.0Terminus-2フレームワーク

66.7

LiveCodeBench (v6)ベンダー報告

89.6

HLE（ツール使用）GPT-5.4とOpus 4.6をリード

54.0

BrowseComp（Agent Swarm）K2.5の78.4から向上

86.3

Artificial Analysis Intelligence Index#4総合、オープンウェイトトップ

Kimi K2.6の価格

プロバイダー定価、100万トークンあたり。

入力$0.60

出力$3.00

キャッシュ読み取り$0.10

キャッシュ書き込み$0.60

Kimi K2.6の実践的な挙動

本番エージェント実行で観測された動作。

長文コンテキスト再現率

Built-inラインアップで社内評価上最強の長文コンテキスト再現率。Anthropic Sonnetがドリフトし始める長いエージェントトランスクリプトでも一貫性を維持します。

エージェントベンチマーク

ベンダー報告のSWE-bench Pro 58.6は執筆時点でラインアップ最高。GPT-5.4とOpus 4.6を上回ります。

長期的コーディング

4,000回以上のツール呼び出しを伴う12時間以上の自律セッションが文書化されています。このモデルは非常に長い実行でも真にパフォーマンスを維持します。

ツール使用

一般的なVM0ツールフローで信頼性があります。Anthropic互換APIにより、Claude向けに設計されたツールスキーマがそのまま動作します。

Kimi K2.6に最適なエージェントタスク

すべての古いスレッドを読まなければならない調査

顧客が解約した理由を見つけるために6ヶ月分のSlack会話を掘り下げる、繰り返し発生するバグパターンをサポートチケットのバックログから探す、100件のRFCにわたるインサイトをつなぎ合わせる。K2.6の長文コンテキスト再現率は、Anthropic Sonnetが初期のターンを見落とし始めるようなトランスクリプトでも維持されます。これは「山全体を読む」ワークフローに必要なものです。

一晩で実行する自律的リファクタリング

Moonshotは8年前のマッチングエンジンの13時間の自律的リファクタリングを文書化しており、K2.6は4,000回以上のツール呼び出しをタスクから逸脱せずに維持しました。これは、ほとんどのモデルが2時間目あたりで目標を見失うような実行です。K2.6の長期的安定性が「金曜の夜に開始して月曜の朝に確認する」を実際に機能させます。

スクリーンショットと動画を扱うマルチモーダルエージェント

K2.6はMoonViTを通じて画像と動画の両方の入力を受け付けます。これはClaudeファミリー以外では珍しいことです。スクリーンショットベースのQAエージェント、ドキュメントビジョンパイプライン、画像を読むためだけに別のビジョンモデルを組み込む必要があるようなデプロイメントに有用です。

Kimi K2.6を避けるべきケース

プロダクションの信頼性でSonnet 4.6が依然リードする最も難しいツールルーティングのエッジケースではK2.6をスキップし、レイテンシが重要なチャット応答ではHaiku 4.5の方が有意に高速です。

Kimi K2.6 vs 他のモデル

Kimi K2.6 vs GLM-5.1

両方とも長文コンテキストの選択肢です。K2.6は社内評価で生の長文コンテキスト再現率が勝り、GLM-5.1はコンテキストサイズ（1M vs 256K）で勝ります。長いトランスクリプトにはK2.6をデフォルトに、1プロンプトで256Kトークンを超える必要がある場合のみGLM-5.1を選択してください。

Kimi K2.6 vs Claude Sonnet 4.6

Sonnet（×1）はマルチツールの英語ルーティング信頼性でリード。K2.6（×0.3）はコストとエージェントベンチマーク（SWE-bench Pro）で勝ります。組み合わせて：複雑なツールルーティングにはSonnet、コスト重視のエージェント作業にはK2.6。

Kimi K2.6 vs Kimi K2.5

K2.6はツール使用が強化され、ハルシネーション率が低く（39% vs 65%）、推論が優れた新世代です。K2.5（×0.2）はわずかに安価です。新規作業にはK2.6を推奨。

結論: Kimi K2.6を使うべきか？

本格的なエージェント作業のためのオープンウェイトデフォルト — 長文コンテキスト、コスト効率。Sonnet 4.6に対する残存ギャップはツールルーティングの信頼性とエンタープライズサポートです。

よくある質問

Kimi K2.6はいつリリースされましたか？

Moonshot AIは2026年4月20日にKimi K2.6をリリースしました。オープンウェイトはModified MITライセンスでHugging Faceに公開されています。

コンテキストウィンドウは？

256Kトークン。K2.6は生のウィンドウサイズではなく、そのサイズでの再現品質で差別化しています。再現率は約180Kを超えると低下し始めます（他の256Kモデルと同様です）。

Kimiを使うためにエージェントを書き換える必要がありますか？

いいえ。Kimi K2.6はAnthropic互換APIを提供しているため、Claude向けに調整されたVM0エージェントはコード変更なしで動作します。

Kimi K2.6はClaude Opus 4.6と比べてどうですか？

エージェントベンチマーク（ベンダー報告）ではK2.6がリード。SWE-bench Pro 58.6 vs Opus 4.6の53.4、HLE（ツール使用）54.0 vs 53.0。Opus 4.6は安全性プロファイルとプロダクションでの英語ツールルーティング信頼性で優位を保っています。

K2.6は画像入力に対応していますか？

はい。K2.6は画像と動画の入力を受け付けます。テキスト出力のみ。マルチモーダルエージェントはネイティブに動作します。

代替モデル

Kimi K2.5

旧世代、わずかに安いマルチプライヤー

GLM-5.1

さらに長いコンテキストウィンドウ（1Mトークン）

DeepSeek V4 Pro

コスト重視の作業のための安価な代替

VM0でKimi K2.6を使う

VM0でKimi K2.6にアクセスする2つの方法

VM0はKimi K2.6を、VM0クレジットで課金されるBuilt-inモデル、およびMoonshot API keyを使用したBring-your-ownの2通りでサポートしています。Built-inパスではVM0 Managedルーティングと後述のクレジット倍率が適用され、Bring-your-ownパスでは上流プロバイダーに直接課金され、VM0クレジットへの変換は行われません。

VM0の推奨

VM0はKimi K2.6をコアエージェントモデルではなく、コスト削減オプションとして位置付けています。一括分類、プレフィルター、レイテンシが重要な短い返信、固定のレガシーエージェントなど、非コア作業の単価最適化に使用し、実行を左右するステップにはClaude Opus 4.7、Claude Opus 4.6、またはClaude Sonnet 4.6を維持します。

クレジットと×0.3倍率

VM0のすべてのBuilt-inモデルは、×1クレジット基準となるClaude Sonnet 4.6の倍数で価格設定されています。Kimi K2.6は×0.3クレジットで課金されます。倍率はVM0の請求書に表示されるもので、上記の価格表のベンダー定価はVM0がクレジットに変換する前に上流プロバイダーが請求する金額です。

Kimi K2.6は×0.3で課金されます。つまり、1ステップのコストはSonnet 4.6（×1基準）の同等ステップのわずか0.3倍です。これはクレジット基準を大きく下回り、ピーク時の推論品質よりもステップあたりのコストが重視される高ボリュームのバックグラウンドワークに自然な選択肢です。

VM0でApril 2026から利用可能。