Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vuosi sitten varmistimme ennakkokatsauksen julkaisemattomasta @OpenAI o3 (High) -versiosta, joka sai 88 % ARC-AGI-1:ssä arviolta 4,5 000 dollaria/tehtävä
Tänään olemme vahvistaneet uuden GPT-5.2 Pro (X-High) SOTA-pisteen 90,5 % hintaan 11,64 dollaria/tehtävä
Tämä tarkoittaa ~390-kertaista tehokkuuden parannusta yhdessä vuodessa

Varmistimme myös, että GPT-5.2 Pro (High) on SOTA ARC-AGI-2:lle, saaden 54,2 % pisteitä 15,72 dollarilla/tehtävä
(API-aikakatkaisujen vuoksi emme pystyneet luotettavasti varmistamaan GPT 5.2 Pro X-Highia ARC-AGI-2:lla)
Kaikki vahvistetut GPT-5.2-perhepisteet:

ARC-AGI saavuttaa vuoden 2019 tavoitteensa viedä tekoäly ulkoa opettelusta kohti tehokasta lennossa tapahtuvaa sopeutumista
Päättelyjärjestelmät osoittavat nyt aitoa virtaavaa älykkyyttä yksinkertaisissa tehtävissä
Vaikka tehokkuus parantui suuresti, ero ihmisiin nähden säilyy
Vuoden 2025 pääpalkintotavoite oli 0,20 dollaria per tehtävä, ja ihmiset ovat useita kertaluokkia tehokkaampia energian suhteen
ARC-AGI-1:stä ja ARC-AGI-2:sta on vielä paljon opittavaa
ARC-AGI-3 (2026) vie tekoälyn kyvykkyyttä ja tehokkuutta entisestään
Se on suunniteltu mittaamaan tekoälyn kykyä oppia ja yleistää tehokkaasti uusissa ympäristöissä, ja se tulee olemaan ensimmäinen laatuaan Interactive Reasoning Benchmark
Pysy kuulolla
Jos satojen uusien pelien julkaiseminen, jotka testaavat tekoälyn rajoja vain muutamassa kuukaudessa, kuulostaa jännittävältä, liity insinööritiimiin, joka luo ARC-AGI-3:n

44,55K
Johtavat
Rankkaus
Suosikit
