Todos los modelos

Kimi K2.5 en VM0. La generación anterior de Moonshot

La generación anterior de Kimi. Más barato que K2.6 pero con uso de herramientas más débil; mantenlo fijado solo si un agente específico fue validado en esta versión.

256K tokens · Text / Image / Code · Prompt cache

Kimi K2.5 es el anterior buque insignia de Moonshot, el modelo de peso abierto que K2.6 reemplazó en abril de 2026. Sigue siendo capaz — fuerte en resúmenes de contexto largo — pero K2.6 lidera en cada benchmark publicado al mismo precio de proveedor, y la brecha en tasa de alucinación es amplia (K2.5 ~65% en la evaluación de Moonshot versus ~39% de K2.6).

El precio de lista del proveedor es $0,60 / $3 por 1M tokens, idéntico a K2.6. La propuesta honesta: si construiste sobre K2.5 y funciona, déjalo; si empiezas desde cero, comienza en K2.6.

¿Qué es Kimi K2.5?

Finales de 2025 (serie Kimi K2) · Generación anterior de la serie Kimi K2 de peso abierto de Moonshot. Reemplazada por K2.6.

Kimi K2.5 fue el modelo Kimi insignia de Moonshot antes de K2.6. Fue el primer Kimi ampliamente desplegado en combinar razonamiento de contexto largo con una superficie API compatible con Claude, y sigue siendo un modelo capaz para trabajo de resumen de contexto largo.

En VM0 tiene el mismo precio de lista de proveedor que K2.6 pero un multiplicador de crédito más bajo (×0,2). El multiplicador más bajo refleja el posicionamiento en lugar del costo bruto por token. K2.6 es el predeterminado recomendado para trabajo nuevo; K2.5 es la fijación legacy.

K2.5 tiene una puntuación SWE-bench Pro reportada por el proveedor de 50,7 y una tasa de alucinación de ~65%. Ambas significativamente por detrás de K2.6 (58,6 y 39%). En comportamiento, se mantiene estable para agentes de producción fijados.

Qué destaca de Kimi K2.5

Características principales de arquitectura y capacidades.

K2.5 es un modelo Mixture-of-Experts con 1B parámetros totales y 32B activos por token de la misma familia que K2.6, con una ventana de contexto de 256K tokens y una superficie API compatible con Anthropic. Los pesos abiertos están publicados en Hugging Face.

Especificaciones rápidas

FamiliaSerie Kimi K2
ModalidadesImagen, texto, código
IdiomasMultilingüe
Ventana de contexto256K tokens
LicenciaMIT Modificada (pesos abiertos)
Disponible en VM0Disponible desde el lanzamiento

Benchmarks de Kimi K2.5

Los benchmarks de K2.5 ahora son más útiles como línea base de comparación para K2.6. El modelo más nuevo lidera en cada métrica publicada al mismo costo de proveedor.

SWE-bench Proreportado por el proveedor
50,7
BrowseCompreportado por el proveedor
78,4
Tasa de alucinaciónbajó a 39% en K2.6
~65%

Precios de Kimi K2.5

Precio de lista del proveedor, por 1M de tokens.

Input$0.60
Output$3.00
Lectura de caché$0.10
Escritura de caché$0.60

Cómo se comporta Kimi K2.5 en la práctica

Comportamiento observado en ejecuciones de agentes en producción.

Contexto largo

Fuerte, forma similar a K2.6 pero con K2.6 teniendo ventaja en benchmarks de recuperación más difíciles.

Uso de herramientas

Sólido en flujos comunes; K2.6 es significativamente mejor en agentes multi-herramienta complejos.

Alucinaciones

Tasa de alucinación reportada por el proveedor de ~65%. Mucho más alta que el 39% de K2.6. Espera más salidas confiadas pero incorrectas.

Mejores tareas para Kimi K2.5

El agente legacy que ya funciona

Tu equipo validó un agente contra K2.5 hace unos meses, los prompts están ajustados, la suite de evaluación pasa, los clientes están contentos. Fijar a K2.5 mantiene ese comportamiento exacto mientras decides si la actualización a K2.6 vale la pena volver a ejecutar la validación. Mismo endpoint de Moonshot, misma interfaz compatible con Anthropic — solo cambian los pesos del modelo cuando cambias.

El trabajo de resumen masivo donde la ventaja de K2.6 no se nota

Transcripciones de cientos de miles de tokens entrando, resúmenes de tres párrafos saliendo. La precisión de enrutamiento de herramientas no es parte de la carga de trabajo, la resistencia a alucinaciones importa menos cuando un humano va a revisar la salida de todos modos, y al mismo precio de proveedor que K2.6 puedes ejecutar K2.5 en estos trabajos sin tocar el pipeline existente.

Cuándo evitar Kimi K2.5

No inicies nuevos agentes en K2.5, ya que K2.6 es una actualización gratuita en todos los sentidos significativos excepto el multiplicador. Evítalo en enrutamiento multi-herramienta en inglés donde Sonnet 4.6 lidera, y en tareas donde la alucinación es costosa porque la tasa de K2.5 es materialmente peor que la de K2.6.

Kimi K2.5 vs otros modelos

Kimi K2.5 vs Kimi K2.6

K2.6 es la generación más reciente con mejor uso de herramientas, menor tasa de alucinación (39% vs 65%) y mejor razonamiento. K2.5 (×0,2) es ligeramente más barato. Elige K2.5 solo para agentes legacy fijados.

Kimi K2.5 vs DeepSeek V4 Pro

DeepSeek V4 Pro (×0,3) tiene razonamiento más fuerte. K2.5 (×0,2) gana en tamaño de contexto y se mantiene dentro de la superficie API de Moonshot.

Conclusión: ¿deberías usar Kimi K2.5?

Modo mantenimiento. Fíjalo si tienes un agente ya validado en él; de lo contrario, comienza en K2.6.

Preguntas frecuentes

¿Por qué K2.5 tiene un multiplicador más bajo que K2.6 al mismo precio de proveedor?

Los multiplicadores reflejan el posicionamiento de VM0 de cada modelo en el catálogo, no solo el costo por token. K2.6 es el predeterminado Kimi recomendado a ×0,3; K2.5 está posicionado como legacy a ×0,2.

¿Debería migrar de K2.5 a K2.6?

Sí para trabajo nuevo. Mismo precio de proveedor, mejor uso de herramientas y razonamiento, tasa de alucinación mucho más baja. Migra los agentes fijados solo después de ejecutarlos en tu suite de regresión.

¿Cuál es la tasa de alucinación?

~65% reportada por el proveedor. Significativamente más alta que K2.6 (39%). Si tu agente reporta hechos a usuarios, esto importa; considera K2.6 en su lugar.

¿Cuál es la ventana de contexto de K2.5?

256K tokens. Igual que K2.6.

Alternativas

Usar Kimi K2.5 en VM0

Dos formas de acceder a Kimi K2.5 en VM0

VM0 admite Kimi K2.5 como modelo Built-in facturado en créditos VM0, y mediante bring-your-own con una Moonshot API key. La ruta Built-in usa enrutamiento gestionado de VM0 y el multiplicador de créditos explicado abajo; la ruta bring-your-own te factura directamente con el proveedor upstream y omite la conversión de créditos VM0.

Recomendación de VM0

VM0 posiciona Kimi K2.5 como una opción de ahorro en lugar de un modelo principal de agente. Úsalo para optimizar el coste unitario en trabajo no principal, como clasificación masiva, prefiltros, respuestas cortas con requisitos de latencia o agentes heredados fijos, manteniendo Claude Opus 4.7, Claude Opus 4.6 o Claude Sonnet 4.6 en los pasos que deciden la ejecución.

Créditos y el multiplicador ×0.2

Cada modelo Built-in en VM0 se valora como un múltiplo de Claude Sonnet 4.6, que establece la base de ×1 crédito. Kimi K2.5 factura a ×0.2 créditos. El multiplicador es lo que aparece en tu factura de VM0; el precio de lista del proveedor en la tabla de arriba es lo que cobra el proveedor upstream antes de que VM0 lo convierta en créditos.

Kimi K2.5 factura a ×0.2, lo que significa que un paso aquí cuesta solo 0.2× los créditos de un paso equivalente en Sonnet 4.6 (la base ×1). Esto lo sitúa muy por debajo de la base de créditos y lo convierte en la elección natural para trabajo en segundo plano de alto volumen donde el coste por paso importa más que la máxima calidad de razonamiento.

Disponible en VM0 desde Available since launch.