Відкриті моделі показують у 2,5 рази швидше, у 6 разів дорожче Менший розмір партії, ускладненість спекулятивного декодування Оптимальна крива Парето для Deepseek показує ось що Claude Opus 4.6 — це 100 Ток/с на користувача Deepseek на 100 — це 6k Tok/s/GPU При 250 ток/с на користувача це ближче до 1k