I dag kunngjør vi ARC Prize Verified, et program for å øke strengheten ved evaluering av grensesystemer på ARC-AGI Dette programmet legger til et tredjeparts akademisk panel for å revidere testprosessen vår Vi ønsker også 5 nye AI-laboratorier velkommen som sponsorer av ARC-AGI-3
ARC-prisen akademisk revisjonsprogram Vi er glade for å ønske fire akademiske rådgivere velkommen for å forbedre testprosessen vår. De vil: - Gi eksternt tilsyn med vår skjulte testsettprotokoll - Revider og verifiser testmetodene våre - Medforfatter av beste praksis for benchmark-testing
Med i panelet i dag er: - Todd Gureckis (professor i psykologi ved NYU) - Guy Van den Broeck (professor i informatikk ved UCLA) - Melanie Mitchell (professor ved Santa Fe-instituttet) - Vishal Misra (visedekan for databehandling og AI ved Columbia)
Velkommen til 5 lab-sponsorer Vi er glade for å kunngjøre våre første eksterne laboratoriebidrag, begrensede midler dedikert til å fremme kvaliteten på ARC-AGI-3 @ndea @xai @Googleorg @NousResearch @PrimeIntellect
ARC-premie verifisert merke Mange organisasjoner er ivrige etter å teste på ARC-AGI, men selvrapporterte poengsummer varierer i testkonsistens Bare poeng evaluert på vårt skjulte testsett vil bli anerkjent som verifiserte ytelsespoeng Et nytt ARC Prize Verified Badge vil angi disse
156