Kimi K2.5 on VM0. Moonshotの前世代
前世代のKimi。K2.6より安価だがツール使用は弱い。このバージョンで特定のエージェントが検証されている場合のみ固定してください。
256K tokens · Text / Image / Code · Prompt cache
Kimi K2.5はMoonshotの前フラッグシップで、2026年4月にK2.6が後継したオープンウェイトモデルです。依然として有能で、長文コンテキスト要約に強いですが、K2.6は同じベンダー価格ですべての公開ベンチマークでリードしており、ハルシネーション率の差は大きいです(K2.5はMoonshotの評価で約65%、K2.6は約39%)。
ベンダー価格は$0.60/$3/1MトークンでK2.6と同じ。正直な売り文句:K2.5で構築して動作しているならそのままに、新規で始めるならK2.6で始めましょう。
Kimi K2.5とは?
2025年後半(Kimi K2シリーズ) · MoonshotのオープンウェイトKimi K2シリーズの前世代。K2.6に後継されました。
Kimi K2.5はK2.6以前のMoonshotのフラッグシップKimiモデルでした。長文コンテキスト推論とClaude互換API表面を組み合わせた初の広く展開されたKimiであり、長文コンテキスト要約作業において有能なモデルであり続けています。
VM0ではK2.6と同じベンダー価格ですが、より低いクレジットマルチプライヤー(×0.2)です。低いマルチプライヤーは生のトークンコストではなくポジショニングを反映しています。K2.6が新規作業の推奨デフォルトで、K2.5はレガシー固定用です。
K2.5のベンダー報告SWE-bench Proスコアは50.7、ハルシネーション率は約65%です。どちらもK2.6(58.6と39%)に有意に劣ります。動作的には、固定されたプロダクションエージェントに対して安定しています。
Kimi K2.5の注目ポイント
アーキテクチャと機能の主な特徴。
K2.5はK2.6と同じファミリーの1T総パラメータ・32Bアクティブ/トークンのMixture-of-Expertsモデルで、256KトークンのコンテキストウィンドウとAnthropic互換API表面を備えています。オープンウェイトはHugging Faceに公開されています。
スペック概要
Kimi K2.5のベンチマーク
K2.5のベンチマークは現在、K2.6の比較ベースラインとして最も有用です。新しいモデルは同じベンダーコストですべての公開指標でリードしています。
Kimi K2.5の価格
プロバイダー定価、100万トークンあたり。
Kimi K2.5の実践的な挙動
本番エージェント実行で観測された動作。
長文コンテキスト
強力で、K2.6と似た形状ですが、より難しい再現ベンチマークではK2.6が優位です。
ツール使用
一般的なフローでは安定。複雑なマルチツールエージェントではK2.6が有意に優れています。
ハルシネーション
ベンダー報告のハルシネーション率は約65%。K2.6の39%よりはるかに高い。自信を持って間違った出力が増えることを想定してください。
Kimi K2.5に最適なエージェントタスク
すでに動作しているレガシーエージェント
あなたのチームは数ヶ月前にK2.5に対してエージェントを検証し、プロンプトは調整済みで、評価スイートはパスし、顧客は満足しています。K2.5に固定することで、K2.6アップグレードの再検証を行う価値があるか判断する間、その正確な動作を維持します。同じMoonshotエンドポイント、同じAnthropic互換インターフェース — 切り替え時に変更されるのはモデルウェイトだけです。
K2.6の優位性が現れないバルク要約ジョブ
数十万トークンのトランスクリプトが入力され、3段落の要約が出力されます。ツールルーティングの精度はワークロードの一部ではなく、ハルシネーション耐性は人間がとにかく出力をざっと読む場合にはあまり重要ではなく、K2.6と同じベンダー価格なので、既存のパイプラインに触れることなくこれらのジョブでK2.5を実行できます。
Kimi K2.5を避けるべきケース
K2.6がマルチプライヤー以外のすべての意味のある面で無料アップグレードであるため、K2.5で新しいエージェントを開始しないでください。Sonnet 4.6がリードするマルチツール英語ルーティングではスキップし、ハルシネーションがコスト高になるタスクでもK2.5の割合がK2.6より著しく悪いためスキップします。
Kimi K2.5 vs 他のモデル
Kimi K2.5 vs Kimi K2.6
K2.6はツール使用が強化され、ハルシネーション率が低く(39% vs 65%)、推論が優れた新世代です。K2.5(×0.2)はわずかに安価です。固定されたレガシーエージェントにのみK2.5を選択してください。
Kimi K2.5 vs DeepSeek V4 Pro
DeepSeek V4 Pro(×0.3)はより強力な推論を持ちます。K2.5(×0.2)はコンテキストサイズで勝り、Moonshot API表面内に留まります。
結論: Kimi K2.5を使うべきか?
メンテナンスモード。すでに検証済みのエージェントがある場合は固定し、それ以外はK2.6で開始してください。
よくある質問
なぜK2.5は同じベンダー価格でK2.6より低いマルチプライヤーなのですか?
マルチプライヤーはVM0の各モデルのラインナップにおけるポジショニングを反映しており、トークンあたりのコストだけではありません。K2.6は×0.3で推奨されるKimiデフォルト、K2.5は×0.2でレガシーとして位置付けられています。
K2.5からK2.6に移行すべきですか?
新規作業の場合ははい。同じベンダー価格で、より強力なツール使用と推論、はるかに低いハルシネーション率です。固定されたエージェントは回帰スイートで実行した後にのみ移行してください。
ハルシネーション率は?
ベンダー報告で約65%。K2.6(39%)より有意に高い。エージェントがユーザーに事実を報告する場合、これは重要です。代わりにK2.6を検討してください。
K2.5のコンテキストウィンドウは?
256Kトークン。K2.6と同じです。
代替モデル
VM0でKimi K2.5を使う
VM0でKimi K2.5にアクセスする2つの方法
VM0はKimi K2.5を、VM0クレジットで課金されるBuilt-inモデル、およびMoonshot API keyを使用したBring-your-ownの2通りでサポートしています。Built-inパスではVM0 Managedルーティングと後述のクレジット倍率が適用され、Bring-your-ownパスでは上流プロバイダーに直接課金され、VM0クレジットへの変換は行われません。
VM0の推奨
VM0はKimi K2.5をコアエージェントモデルではなく、コスト削減オプションとして位置付けています。一括分類、プレフィルター、レイテンシが重要な短い返信、固定のレガシーエージェントなど、非コア作業の単価最適化に使用し、実行を左右するステップにはClaude Opus 4.7、Claude Opus 4.6、またはClaude Sonnet 4.6を維持します。
クレジットと×0.2倍率
VM0のすべてのBuilt-inモデルは、×1クレジット基準となるClaude Sonnet 4.6の倍数で価格設定されています。Kimi K2.5は×0.2クレジットで課金されます。倍率はVM0の請求書に表示されるもので、上記の価格表のベンダー定価はVM0がクレジットに変換する前に上流プロバイダーが請求する金額です。
Kimi K2.5は×0.2で課金されます。つまり、1ステップのコストはSonnet 4.6(×1基準)の同等ステップのわずか0.2倍です。これはクレジット基準を大きく下回り、ピーク時の推論品質よりもステップあたりのコストが重視される高ボリュームのバックグラウンドワークに自然な選択肢です。
VM0でAvailable since launchから利用可能。