Сьогодні ми оголошуємо про ARC Prize Verified, програму, спрямовану на підвищення суворості оцінки прикордонних систем на ARC-AGI Ця програма додає сторонню академічну групу для аудиту нашого процесу тестування Ми також вітаємо 5 нових лабораторій штучного інтелекту в якості спонсорів ARC-AGI-3
Програма академічного аудиту премії ARC Ми раді вітати чотирьох академічних керівників, які вдосконалюють наш процес тестування. Вони будуть: - Забезпечення зовнішнього нагляду за нашим протоколом прихованого тестового набору - Аудит і перевірка наших методів тестування - Співавтор кращих практик для бенчмарк-тестування
Сьогодні до панелі приєдналися: - Тодд Гурекіс (професор психології в Нью-Йоркському університеті) - Гай Ван ден Брук (професор комп'ютерних наук в Каліфорнійському університеті в Лос-Анджелесі) - Мелані Мітчелл (професор Інституту Санта-Фе) - Вішал Місра (заступник декана факультету обчислювальної техніки та штучного інтелекту в Колумбійському університеті)
Вітаємо 5 спонсорів Лабораторії Ми раді оголосити про наші перші зовнішні внески в лабораторії, обмежені кошти, спрямовані на підвищення якості ARC-AGI-3 @ndea @xai @Googleorg @NousResearch @PrimeIntellect
Значок «Верифікований приз ARC» Багато організацій охоче проводять тестування на ARC-AGI, але результати, про які повідомляють самостійно, різняться за стабільністю тестування Лише результати, оцінені в нашому прихованому тестовому наборі, будуть визнані як підтверджені результати На цьому буде позначено новий значок ARC Prize Verified Badge
163