Aujourd'hui, nous annonçons le programme ARC Prize Verified, un programme visant à renforcer la rigueur de l'évaluation des systèmes de pointe sur ARC-AGI Ce programme ajoute un panel académique tiers pour auditer notre processus de test Nous accueillons également 5 nouveaux laboratoires d'IA en tant que sponsors d'ARC-AGI-3
Programme d'Audit Académique du Prix ARC Nous sommes ravis d'accueillir quatre conseillers académiques pour améliorer notre processus de test. Ils vont : - Fournir une supervision externe de notre protocole de test caché - Auditer et vérifier nos méthodes de test - Co-écrire les meilleures pratiques pour les tests de référence
Les membres du panel aujourd'hui sont : - Todd Gureckis (Professeur de psychologie à NYU) - Guy Van den Broeck (Professeur d'informatique à UCLA) - Melanie Mitchell (Professeur à l'Institut de Santa Fe) - Vishal Misra (Vice-doyen de l'informatique et de l'IA à Columbia)
Bienvenue aux 5 sponsors de laboratoire Nous sommes ravis d'annoncer nos premières contributions externes au laboratoire, des fonds restreints dédiés à l'avancement de la qualité de l'ARC-AGI-3 @ndea @xai @Googleorg @NousResearch @PrimeIntellect
Badge Vérifié du Prix ARC De nombreuses organisations sont désireuses de tester sur ARC-AGI, mais les scores auto-déclarés varient en termes de cohérence des tests. Seuls les scores évalués sur notre ensemble de tests caché seront reconnus comme des scores de performance vérifiés. Un nouveau Badge Vérifié du Prix ARC indiquera cela.
168