Modelele deschise arată de 2,5 ori mai rapid, de 6 ori mai scump Dimensiunea lotului mai mică, decodarea speculativă este mai dificilă Curba optimă Pareto pentru Deepseek la arată acest lucru Claude Opus 4.6 are 100 Tok/s/utilizator Deepseek la 100 este 6k Tok/s/GPU La 250 tok/s/utilizator e mai aproape de 1k