Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
För ett år sedan verifierade vi en förhandsvisning av en osläppt version av @OpenAI o3 (High) som fick 88 % på ARC-AGI-1 med ett uppskattningspris på 4,5 000 dollar per uppgift
Idag har vi verifierat ett nytt GPT-5.2 Pro (X-High) SOTA-poäng på 90,5 % till 11,64 dollar per uppgift
Detta motsvarar en ~390-faldig effektivitetsförbättring på ett år

Vi verifierade också att GPT-5.2 Pro (High) är SOTA för ARC-AGI-2, med 54,2 % för 15,72 dollar per uppgift
(På grund av API-timeouts kunde vi inte pålitligt verifiera GPT 5.2 Pro X-High på ARC-AGI-2)
Alla verifierade GPT-5.2-familjepoäng:

ARC-AGI uppnår sitt mål från 2019 att driva AI bortom memorering mot effektiv anpassning i realtid
Resonemangssystem visar nu genuin flytande intelligens på enkla uppgifter
Även med denna stora effektivitetsförbättring kvarstår ett stort gap jämfört med människor
Målet för Grand Prize 2025 var 0,20 dollar per uppgift och människor är flera storleksordningar mer effektiva energimässigt sett
Det finns fortfarande mycket att lära av ARC-AGI-1 och ARC-AGI-2
ARC-AGI-3 (2026) kommer att driva AI-kapacitet och effektivitet ännu mer
Designad för att mäta AI:s förmåga att effektivt lära sig och generalisera i nya miljöer, kommer den att vara ett unikt Interactive Reasoning Benchmark
Fortsätt följa
Om det låter spännande att släppa hundratals nya spel som testar AI:s gräns på bara några månader, gå med i ingenjörsteamet som skapar ARC-AGI-3

44,66K
Topp
Rankning
Favoriter
