Avoimet mallit näyttävät 2,5 kertaa nopeammin, 6 kertaa kalliimmin Pienempi eräkoko, spekulatiivinen dekoodaus vaikeampaa Pareto-optimaalinen käyrä Deepseekille osoittaa tämän Claude Opus 4.6 on 100 Tok/s/käyttäjä Deepseek 100:lla on 6k Tok/s/GPU 250 tok/s/käyttäjä on lähempänä 1000:ta