Vuosi sitten varmistimme ennakkokatsauksen julkaisemattomasta @OpenAI o3 (High) -versiosta, joka sai 88 % ARC-AGI-1:ssä arviolta 4,5 000 dollaria/tehtävä Tänään olemme vahvistaneet uuden GPT-5.2 Pro (X-High) SOTA-pisteen 90,5 % hintaan 11,64 dollaria/tehtävä Tämä tarkoittaa ~390-kertaista tehokkuuden parannusta yhdessä vuodessa
Varmistimme myös, että GPT-5.2 Pro (High) on SOTA ARC-AGI-2:lle, saaden 54,2 % pisteitä 15,72 dollarilla/tehtävä (API-aikakatkaisujen vuoksi emme pystyneet luotettavasti varmistamaan GPT 5.2 Pro X-Highia ARC-AGI-2:lla) Kaikki vahvistetut GPT-5.2-perhepisteet:
ARC-AGI saavuttaa vuoden 2019 tavoitteensa viedä tekoäly ulkoa opettelusta kohti tehokasta lennossa tapahtuvaa sopeutumista Päättelyjärjestelmät osoittavat nyt aitoa virtaavaa älykkyyttä yksinkertaisissa tehtävissä
Vaikka tehokkuus parantui suuresti, ero ihmisiin nähden säilyy Vuoden 2025 pääpalkintotavoite oli 0,20 dollaria per tehtävä, ja ihmiset ovat useita kertaluokkia tehokkaampia energian suhteen ARC-AGI-1:stä ja ARC-AGI-2:sta on vielä paljon opittavaa
ARC-AGI-3 (2026) vie tekoälyn kyvykkyyttä ja tehokkuutta entisestään Se on suunniteltu mittaamaan tekoälyn kykyä oppia ja yleistää tehokkaasti uusissa ympäristöissä, ja se tulee olemaan ensimmäinen laatuaan Interactive Reasoning Benchmark Pysy kuulolla
Jos satojen uusien pelien julkaiseminen, jotka testaavat tekoälyn rajoja vain muutamassa kuukaudessa, kuulostaa jännittävältä, liity insinööritiimiin, joka luo ARC-AGI-3:n
44,55K