2,5 gånger snabbare men 6 gånger dyrare. Detta kan inte uppnås genom inferensoptimering, det måste vara nya chip. TPU? B200? AWS Inferentia? Cerebras?