DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Een jaar geleden hebben we een preview geverifieerd van een ongepubliceerde versie van @OpenAI o3 (Hoog) die 88% scoorde op ARC-AGI-1 tegen een geschatte prijs van $4,5k/taken Vandaag hebben we een nieuwe GPT-5.2 Pro (X-Hoog) SOTA-score van 90,5% geverifieerd tegen $11,64/taken Dit vertegenwoordigt een ~390X efficiëntieverbetering in één jaar

We hebben ook geverifieerd dat GPT-5.2 Pro (Hoog) SOTA is voor ARC-AGI-2, met een score van 54,2% voor $15,72/tas (Vanwege API-timeouts konden we GPT 5.2 Pro X-Hoog op ARC-AGI-2 niet betrouwbaar verifiëren) Alle geverifieerde scores van de GPT-5.2-familie:

ARC-AGI bereikt zijn doel van 2019 om AI verder te brengen dan alleen memorisatie, naar efficiënte aanpassing in real-time. Redeneringssystemen tonen nu echte vloeiende intelligentie bij eenvoudige taken.

Zelfs met deze grote efficiëntieverbetering blijft er een grote kloof ten opzichte van mensen Het doel voor de Grote Prijs van 2025 was $0,20/taken en mensen zijn verschillende ordes van grootte efficiënter op basis van energie Er is nog veel te leren van ARC-AGI-1 en ARC-AGI-2

ARC-AGI-3 (2026) zal de AI-capaciteit en efficiëntie nog verder verbeteren Ontworpen om het vermogen van AI te meten om efficiënt te leren en te generaliseren in nieuwe omgevingen, zal het een eerste interactieve redeneerbenchmark zijn Blijf op de hoogte

Als het spannend klinkt om in slechts een paar maanden honderden nieuwe games te verzenden die de grenzen van AI testen, sluit je dan aan bij het engineeringteam dat ARC-AGI-3 creëert.

44,58K

Boven

Positie

Favorieten