Todos los casos de uso

Reduce el gasto en IA sin sacrificar calidad

Zero audita las ejecuciones de tus agentes, clasifica las tareas por complejidad y recomienda cambios de modelo que ahorran dinero — para que dejes de usar Opus para tareas que Sonnet maneja perfectamente.

Zero conecta:Slackvm0

Por qué tu factura de IA no deja de subir

Fin de mes. Llega la factura de infraestructura de IA: 17.000$ este mes, frente a 12.000$ del anterior. Revisas y descubres que el escaneo diario de deuda técnica — que ejecuta unos cuantos scripts de grep y crea issues en GitHub — está usando Claude Opus. El monitor de merge queue, que comprueba si CI está en verde y publica en Slack, también está en Opus. Ninguna tarea necesita nada parecido a Opus. Podrías auditar cada programación manualmente, o pedirle a Zero que clasifique cada tarea por complejidad y recomiende cuáles degradar.

Cómo pedirle a Zero que optimice tus costes de IA

@Zero audita todas las programaciones y ejecuciones de agentes. Clasifica cada tarea como baja, media o alta complejidad según el trabajo real realizado. Recomienda qué tareas pueden cambiar a un modelo más económico sin pérdida de calidad. Publica el informe en Slack.

Cómo Zero identifica oportunidades de ahorro

Zero audita todas las ejecuciones de agentes y el uso de tokens
Zero consulta tus logs de ejecución de agentes, examina qué hace realmente cada tarea — cuántos turnos, qué herramientas invoca, qué tan complejo es el razonamiento — y calcula el coste actual por tarea.
Zero clasifica las tareas por nivel de complejidad
Zero ordena las tareas en tres categorías: baja complejidad (leer-y-resumir, grep-y-publicar), media complejidad (agregación multi-fuente, análisis estructurado) y alta complejidad (generación de código, razonamiento abierto). Cada nivel recibe un modelo recomendado.
Zero publica recomendaciones accionables con estimaciones de ahorro
La auditoría de costes llega a Slack con una tabla clara: modelo actual, modelo recomendado y ahorro estimado por tarea. Zero señala qué cambios son seguros de hacer inmediatamente y cuáles necesitan un período de prueba para verificar calidad.

Implementa optimizaciones de costes de forma segura

Cambia una tarea de bajo riesgo a un modelo más económico
Empieza con la recomendación más segura y verifica que la calidad se mantiene.
@Zero cambia la programación de merge-queue-monitor para usar GLM-5.1 en vez de Sonnet
Ejecuta una prueba comparativa
Ejecuta la misma tarea en ambos modelos y compara los resultados antes de comprometerte.
@Zero ejecuta el prompt de tech-debt-scan en Opus y GLM-5.1, luego compara los resultados lado a lado
Hazlo rutina
Programa auditorías de costes semanales para que el gasto nunca suba inadvertidamente.
@Zero cada lunes a las 9am, audita los costes de agentes y publica recomendaciones de optimización en #dev

Integraciones requeridas: vm0 y Slack

vm0
vm0
vm0 — proporciona acceso a logs de ejecución de agentes, configuraciones de programación y datos de facturación de modelos. Zero usa esto para analizar qué hace cada tarea y cuánto cuesta.
Obligatorio
Slack
Slack
Slack — entrega el informe de optimización de costes a tu canal de engineering o dev.
Obligatorio

Buenas prácticas para la optimización de costes de IA

Empieza con tareas de bajo riesgo — monitorización, notificaciones y resúmenes diarios son seguras de degradar primero. Generación de código y razonamiento abierto deberían ser lo último.
Haz seguimiento de las métricas de calidad antes y después de cada cambio. Si error-triage-daily empieza a perder issues tras un cambio de modelo, revierte inmediatamente.
Revisa los informes de costes semanalmente, no mensualmente — las fugas pequeñas se acumulan rápido, y una cadencia semanal detecta problemas antes de que llegue la factura.