Các mô hình mở cho thấy nhanh hơn 2.5 lần, đắt hơn 6 lần Kích thước lô thấp hơn, giải mã suy đoán khó hơn Đường cong tối ưu Pareto cho Deepseek cho thấy điều này Claude Opus 4.6 là 100 Tok/s/user Deepseek ở 100 là 6k Tok/s/GPU Ở 250 tok/s/user thì gần 1k hơn