2,5 ganger raskere, men 6 ganger dyrere. Dette kan ikke oppnås med inferensoptimalisering, det må være nye brikker. TPU? B200? AWS Inferentia? Cerebras?