Bugün, ARC-AGI'de sınır sistemlerini değerlendirmenin titizliğini artırmaya yönelik bir program olan ARC Prize Verified'ı duyuruyoruz Bu program, test sürecimizi denetlemek için üçüncü taraf bir akademik panel ekler Ayrıca ARC-AGI-5'ün sponsoru olarak 3 yeni yapay zeka laboratuvarını da ağırlıyoruz
ARC Ödülü Akademik Denetim Programı Test sürecimizi iyileştirmek için dört akademik danışmanı ağırlamaktan heyecan duyuyoruz. Yapacaklar: - Gizli test seti protokolümüzün harici gözetimini sağlayın - Test yöntemlerimizi denetleyin ve doğrulayın - Karşılaştırma testi için en iyi uygulamaları birlikte yazın
Bugün panele katılanlar: - Todd Gureckis (NYU'da Psikoloji Profesörü) - Guy Van den Broeck (UCLA'da Bilgisayar Bilimleri Profesörü) - Melanie Mitchell (Santa Fe Enstitüsü'nde Profesör) - Vishal Misra (Columbia'da Bilgisayar ve Yapay Zeka Dekan Yardımcısı)
5 Laboratuvar Sponsorunu Karşılıyoruz ARC-AGI-3'ün kalitesini artırmaya adanmış ilk harici laboratuvar katkılarımızı, kısıtlı fonlarımızı duyurmaktan heyecan duyuyoruz @ndea @xai @Googleorg @NousResearch @PrimeIntellect
ARC Ödülü Doğrulanmış Rozeti Birçok kuruluş ARC-AGI üzerinde test yapmaya heveslidir, ancak kendi bildirdiği puanlar test tutarlılığı açısından farklılık gösterir Yalnızca gizli test setimizde değerlendirilen puanlar, doğrulanmış performans puanları olarak kabul edilecektir Yeni bir ARC Ödülü Doğrulanmış Rozeti bunları gösterecektir
167