För ett år sedan verifierade vi en förhandsvisning av en osläppt version av @OpenAI o3 (High) som fick 88 % på ARC-AGI-1 med ett uppskattningspris på 4,5 000 dollar per uppgift Idag har vi verifierat ett nytt GPT-5.2 Pro (X-High) SOTA-poäng på 90,5 % till 11,64 dollar per uppgift Detta motsvarar en ~390-faldig effektivitetsförbättring på ett år
Vi verifierade också att GPT-5.2 Pro (High) är SOTA för ARC-AGI-2, med 54,2 % för 15,72 dollar per uppgift (På grund av API-timeouts kunde vi inte pålitligt verifiera GPT 5.2 Pro X-High på ARC-AGI-2) Alla verifierade GPT-5.2-familjepoäng:
ARC-AGI uppnår sitt mål från 2019 att driva AI bortom memorering mot effektiv anpassning i realtid Resonemangssystem visar nu genuin flytande intelligens på enkla uppgifter
Även med denna stora effektivitetsförbättring kvarstår ett stort gap jämfört med människor Målet för Grand Prize 2025 var 0,20 dollar per uppgift och människor är flera storleksordningar mer effektiva energimässigt sett Det finns fortfarande mycket att lära av ARC-AGI-1 och ARC-AGI-2
ARC-AGI-3 (2026) kommer att driva AI-kapacitet och effektivitet ännu mer Designad för att mäta AI:s förmåga att effektivt lära sig och generalisera i nya miljöer, kommer den att vara ett unikt Interactive Reasoning Benchmark Fortsätt följa
Om det låter spännande att släppa hundratals nya spel som testar AI:s gräns på bara några månader, gå med i ingenjörsteamet som skapar ARC-AGI-3
44,66K