ho trovato questo codice superpotente di claude ed è un po' geniale questo è un repository chiamato claude-code-hub - una piattaforma unica per gestire più fornitori di AI (claude, openai, gemini, codex) cosa fa: - bilanciamento del carico intelligente: imposta pesi e priorità per ogni fornitore. se hai più chiavi API, distribuisce le richieste tra di esse. interruttore di circuito integrato che rileva quando un fornitore sta fallendo e reindirizza automaticamente (fino a 3 tentativi) - gestione delle sessioni: cache di contesto di 5 minuti così non devi continuamente cambiare fornitore a metà conversazione. tiene traccia della "catena decisionale" di quale fornitore ha gestito cosa, utile per il debug di comportamenti strani - limitazione della velocità: limita per RPM, per costo (limiti di 5 ore/settimana/mensili), o per sessioni concorrenti. utilizza script lua di redis quindi i limiti sono atomici. se redis va giù, fallisce in modo aperto invece di bloccare tutto - tracciamento dei costi reali: mostra l'uso per utente, consumo di token, costi nel tempo. ha una vista della classifica così puoi vedere chi sta bruciando crediti. si sincronizza con i prezzi di litellm - strato di compatibilità openai: se hai strumenti costruiti per il formato API di openai, questo li fa funzionare con claude invece. gestisce automaticamente la conversione di formato, le chiamate agli strumenti, i campi di ragionamento per chi è questo: - team che vogliono una fatturazione/tracciamento unificati tra i fornitori - chiunque stia raggruppando più chiavi API per ridondanza persone che vogliono un failover automatico quando un fornitore va giù - organizzazioni che necessitano di registri di audit di tutte le chiamate API AI
link del repo:
129