I modelli aperti mostrano una velocità 2,5 volte superiore, 6 volte più costosi Dimensione del batch inferiore, decodifica speculativa più difficile La curva ottimale di Pareto per Deepseek mostra questo Claude Opus 4.6 è 100 Tok/s/utente Deepseek a 100 è 6k Tok/s/GPU A 250 tok/s/utente è più vicino a 1k