開放模型顯示速度快 2.5 倍,成本高 6 倍 較低的批次大小,推測解碼更困難 Deepseek 的帕累托最優曲線顯示這一點 Claude Opus 4.6 是 100 Tok/s/用戶 Deepseek 在 100 時是 6k Tok/s/GPU 在 250 tok/s/用戶時更接近 1k