Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Een jaar geleden hebben we een preview geverifieerd van een ongepubliceerde versie van @OpenAI o3 (Hoog) die 88% scoorde op ARC-AGI-1 tegen een geschatte prijs van $4,5k/taken
Vandaag hebben we een nieuwe GPT-5.2 Pro (X-Hoog) SOTA-score van 90,5% geverifieerd tegen $11,64/taken
Dit vertegenwoordigt een ~390X efficiëntieverbetering in één jaar

We hebben ook geverifieerd dat GPT-5.2 Pro (Hoog) SOTA is voor ARC-AGI-2, met een score van 54,2% voor $15,72/tas
(Vanwege API-timeouts konden we GPT 5.2 Pro X-Hoog op ARC-AGI-2 niet betrouwbaar verifiëren)
Alle geverifieerde scores van de GPT-5.2-familie:

ARC-AGI bereikt zijn doel van 2019 om AI verder te brengen dan alleen memorisatie, naar efficiënte aanpassing in real-time.
Redeneringssystemen tonen nu echte vloeiende intelligentie bij eenvoudige taken.
Zelfs met deze grote efficiëntieverbetering blijft er een grote kloof ten opzichte van mensen
Het doel voor de Grote Prijs van 2025 was $0,20/taken en mensen zijn verschillende ordes van grootte efficiënter op basis van energie
Er is nog veel te leren van ARC-AGI-1 en ARC-AGI-2
ARC-AGI-3 (2026) zal de AI-capaciteit en efficiëntie nog verder verbeteren
Ontworpen om het vermogen van AI te meten om efficiënt te leren en te generaliseren in nieuwe omgevingen, zal het een eerste interactieve redeneerbenchmark zijn
Blijf op de hoogte
Als het spannend klinkt om in slechts een paar maanden honderden nieuwe games te verzenden die de grenzen van AI testen, sluit je dan aan bij het engineeringteam dat ARC-AGI-3 creëert.

44,58K
Boven
Positie
Favorieten
