Oggi annunciamo ARC Prize Verified, un programma per aumentare la rigorosità nella valutazione dei sistemi all'avanguardia su ARC-AGI Questo programma aggiunge un pannello accademico di terze parti per auditare il nostro processo di test Accogliamo anche 5 nuovi laboratori di AI come sponsor di ARC-AGI-3
Programma di Audit Accademico del Premio ARC Siamo entusiasti di dare il benvenuto a quattro consulenti accademici per migliorare il nostro processo di test. Loro: - Forniranno supervisione esterna del nostro protocollo del set di test nascosto - Auditeranno e verificheranno i nostri metodi di test - Co-autoreranno le migliori pratiche per il test di benchmark
Oggi partecipano al panel: - Todd Gureckis (Professore di Psicologia alla NYU) - Guy Van den Broeck (Professore di Informatica all'UCLA) - Melanie Mitchell (Professore presso il Santa Fe Institute) - Vishal Misra (Vice Decano di Informatica e AI alla Columbia)
Accogliendo 5 Sponsor del Laboratorio Siamo entusiasti di annunciare i nostri primi contributi esterni al laboratorio, fondi vincolati dedicati a migliorare la qualità di ARC-AGI-3 @ndea @xai @Googleorg @NousResearch @PrimeIntellect
Badge di Verifica del Premio ARC Molte organizzazioni sono ansiose di testare su ARC-AGI, ma i punteggi auto-riportati variano nella coerenza dei test Solo i punteggi valutati sul nostro set di test nascosto saranno riconosciuti come punteggi di prestazione verificati Un nuovo Badge di Verifica del Premio ARC denoterà questi
162