Los modelos abiertos muestran 2,5 veces más rápido y 6 veces más caro Menor tamaño de lote, decodificación especulativa más difícil La curva óptima de Pareto para Deepseek en muestra esto Claude Opus 4.6 es 100 Tok/s/usuario Deepseek a 100 cuesta 6k Tok/s/GPU A 250 tok/s/usuario está más cerca de 1.000