Ottimizza automaticamente i costi degli agenti AI

Zero verifica le run dei tuoi agenti, classifica i task per complessità e consiglia cambi di modello che riducono la spesa senza sacrificare la qualità dell'output.

Zero connette:

Cosa offre Zero

Ottimizza automaticamente i costi degli agenti AI — sample output from Zero — screenshot 1

Qual è il problema

Fine mese. Arriva la fattura dell'infrastruttura AI: 17.000 $ questo mese, in aumento rispetto ai 12.000 $ del mese scorso. Scavi e scopri che la scansione giornaliera del debito tecnico - che esegue qualche script grep e apre issue su GitHub - sta usando Claude Opus. Anche il monitoraggio della coda di merge, che controlla se la CI è verde e pubblica su Slack, è su Opus. Nessuno dei due task ha bisogno di qualcosa che si avvicini a Opus. Potresti verificare ogni schedule manualmente, oppure potresti chiedere a Zero di classificare ogni task per complessità e consigliare quali declassare.

Come Zero lo risolve

Passo 1: Connetti i tuoi strumenti

Slack

Obbligatorio

vm0 - fornisce accesso ai log delle run degli agenti, alle configurazioni degli schedule e ai dati di fatturazione dei modelli. Zero li usa per analizzare cosa fa ogni task e quanto costa.

Connetti

Passo 2: Chiedi a Zero

@Zero verifica tutti gli schedule e le run degli agenti. Classifica ogni task come complessità bassa, media o alta in base al lavoro effettivamente svolto. Consiglia quali task possono passare in sicurezza a un modello più economico senza perdita di qualità. Pubblica il report su Slack.

provalo

Zero verifica tutte le run degli agenti e l'utilizzo dei token

Zero interroga i log delle run dei tuoi agenti, esamina cosa fa effettivamente ogni task - quanti turni, quali strumenti chiama, quanto è complesso il ragionamento - e calcola il costo attuale per task.

Zero classifica i task per livello di complessità

Zero ordina i task in tre categorie: bassa complessità (leggi-e-riassumi, grep-e-pubblica), media complessità (aggregazione multi-sorgente, analisi strutturata) e alta complessità (generazione di codice, ragionamento aperto). Ogni livello ottiene un modello consigliato.

Zero pubblica raccomandazioni concrete con stime di risparmio

L'audit dei costi arriva su Slack con una tabella chiara: modello attuale, modello consigliato e risparmio stimato per task. Zero segnala quali cambi sono sicuri da effettuare subito e quali necessitano di un periodo di prova per verificare la qualità.

Passo 3: Vai oltre

Passa un task a basso rischio a un modello più economico

Inizia dalla raccomandazione più sicura e verifica che la qualità si mantenga.

@Zero passa lo schedule merge-queue-monitor a usare GLM-5.2 invece di Sonnet

provalo

Esegui un test di confronto

Esegui lo stesso task su entrambi i modelli e confronta gli output prima di decidere.

@Zero esegui il prompt tech-debt-scan sia su Opus che su GLM-5.2, poi confronta i risultati affiancati

provalo

Rendilo abituale

Programma audit dei costi settimanali così la spesa non cresce mai inosservata.

@Zero ogni lunedì alle 9, verifica i costi degli agenti e pubblica i consigli di ottimizzazione in #dev

provalo

Suggerimenti per risultati migliori

●Inizia dai task a basso rischio - monitoraggio, notifiche e riepiloghi giornalieri sono sicuri da declassare per primi. La generazione di codice e il ragionamento aperto dovrebbero venire per ultimi.

●Monitora le metriche di qualità prima e dopo ogni cambio. Se error-triage-daily inizia a mancare problemi dopo un cambio di modello, torna subito indietro.

●Rivedi i report sui costi ogni settimana, non ogni mese - le piccole perdite si sommano in fretta, e una cadenza settimanale individua i problemi prima che arrivi la fattura.