2,5 veces más rápido pero 6 veces más caro. Esto no se puede lograr mediante optimización por inferencia, deben ser chips nuevos. ¿TPU? ¿200 B200? ¿AWS Inferentia? ¿Cerebras?