Heute kündigen wir das ARC Prize Verified an, ein Programm zur Erhöhung der Strenge bei der Bewertung von Grenzsystemen auf ARC-AGI. Dieses Programm fügt ein akademisches Gremium von Dritten hinzu, um unseren Testprozess zu überprüfen. Wir heißen auch 5 neue KI-Labore als Sponsoren von ARC-AGI-3 willkommen.
ARC Preis Akademische Prüfungsprogramm Wir freuen uns, vier akademische Berater willkommen zu heißen, um unseren Testprozess zu verbessern. Sie werden: - Externe Aufsicht über unser Protokoll für versteckte Testsets bieten - Unsere Testmethoden prüfen und verifizieren - Best Practices für Benchmark-Tests mitverfassen
Heute sind im Panel: - Todd Gureckis (Professor für Psychologie an der NYU) - Guy Van den Broeck (Professor für Informatik an der UCLA) - Melanie Mitchell (Professorin am Santa Fe Institute) - Vishal Misra (Vize-Dekan für Computing und AI an der Columbia)
Begrüßung von 5 Labor-Sponsoren Wir freuen uns, unsere ersten externen Laborbeiträge bekannt zu geben, zweckgebundene Mittel, die der Verbesserung der Qualität von ARC-AGI-3 gewidmet sind. @ndea @xai @Googleorg @NousResearch @PrimeIntellect
ARC Prize Verifiziertes Abzeichen Viele Organisationen sind daran interessiert, auf ARC-AGI zu testen, aber die selbst gemeldeten Ergebnisse variieren in der Testkonsistenz. Nur Ergebnisse, die in unserem versteckten Testset bewertet wurden, werden als verifizierte Leistungswerte anerkannt. Ein neues ARC Prize Verifiziertes Abzeichen wird dies kennzeichnen.
166