Offene Modelle zeigen 2,5x schneller, 6x teurer Niedrigere Batch-Größe, spekulatives Decoding schwieriger Die Pareto-optimale Kurve für Deepseek zeigt dies Claude Opus 4.6 ist 100 Tok/s/Nutzer Deepseek bei 100 ist 6k Tok/s/GPU Bei 250 tok/s/Nutzer ist es näher an 1k