Modelos abertos mostram 2,5x mais rápidos, 6x mais caros Tamanho de lote menor, decodificação especulativa mais difícil A curva ótima de Pareto para o Deepseek mostra isso Claude Opus 4.6 é 100 Tok/s/usuário Deepseek a 100 é 6k Tok/s/GPU A 250 tok/s/usuário está mais próximo de 1k