本日、ARC-AGIでのフロンティアシステム評価の厳密さを高めるプログラムであるARC Prize Verifiedを発表します このプログラムでは、テストプロセスを監査するためにサードパーティの学術パネルが追加されます また、ARC-AGI-3 のスポンサーとして 5 つの新しい AI ラボを迎えます
ARC賞学術監査プログラム テストプロセスを改善するために4人のアカデミックアドバイザーを迎えることができてうれしく思います。彼らは次のことを行います。 - 隠しテストセットプロトコルの外部監視を提供します - 当社のテスト方法の監査と検証 - ベンチマークテストのベストプラクティスを共同執筆
本日のパネルに参加するのは次のとおりです。 - トッド・グレキス(ニューヨーク大学心理学教授) - ガイ・ヴァン・デン・ブルック(UCLAコンピュータサイエンス教授) - メラニー・ミッチェル(サンタフェ研究所教授) - ヴィシャル・ミスラ (コロンビア大学コンピューティングおよび AI 担当副学部長)
5つのラボスポンサーを歓迎します ARC-AGI-3の品質向上に特化した制限付き基金である、最初の外部ラボへの寄付を発表できることを嬉しく思います @ndea @xai @Googleorg @NousResearch @PrimeIntellect
ARCプライズ認証バッジ 多くの組織が ARC-AGI でのテストに熱心ですが、自己申告スコアはテストの一貫性にばらつきがあります 非表示のテストセットで評価されたスコアのみが検証済みのパフォーマンススコアとして認識されます 新しいARCプライズ認証バッジは、これらを示します
158