Les modèles ouverts montrent 2,5 fois plus rapide, 6 fois plus cher Taille de lot plus faible, décodage spéculatif plus difficile La courbe de Pareto optimale pour Deepseek montre cela Claude Opus 4.6 est à 100 Tok/s/utilisateur Deepseek à 100 est à 6k Tok/s/GPU À 250 tok/s/utilisateur, c'est plus proche de 1k