У 2,5 рази швидше, але в 6 разів дорожче. Цього неможливо досягти оптимізацією виведення — потрібні нові чипи. TPU? B200? AWS Inferentia? Церебра?