速度快 2.5 倍,但價格貴 6 倍。 這無法通過推理優化來實現,必須是新晶片。 TPU?B200?AWS Inferentia?Cerebras?