Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Compresia modelelor AI a făcut pentru prima dată inferența onchain viabilă economic.
Rularea unui model de 7B parametri costa 2-3 dolari pe apel de inferență când luai în calcul taxele de gaz și overhead-ul de calcul. Acest preț face ca orice aplicație AI destinată consumatorilor să fie moartă din prima apariție. Nu poți construi un chatbot care să coste utilizatorilor 2 dolari pe mesaj. Economia nu a funcționat niciodată.
Tehnicile de cuantificare și tăiere comprimă modelele la parametri 1-2B fără a pierde prea multă acuratețe. Brusc, costurile inferenței scad la 0,10-0,20 $ pe apel. Încă nu este gratuit, dar acum ești în intervalul în care modelele de microplăți devin viabile. Utilizatorii pot plăti fracțiuni de cent pe interacțiune, dezvoltatorii pot acoperi costurile fără subvenții de la VC, iar economia unitară chiar se închide.
Când inferența devine suficient de ieftină pentru a susține aplicații reale, nu doar demo-uri, deblochezi un spațiu de design complet diferit. Agenți AI care trăiesc complet onchain, interacționează continuu cu utilizatorii și nu necesită dependențe centralizate de API. Atunci DeAI încetează să mai fie un proiect de cercetare și începe să fie infrastructură.
Uită-te la 0G.
Limită superioară
Clasament
Favorite
