Bir yıl önce, ARC-AGI-1'de %88 puan alan ve henüz yayınlanmamış bir @OpenAI o3 (Yüksek) versiyonunun önizlemesini doğruladık; tahmini $4.5k $/görev Bugün, yeni bir GPT-5.2 Pro (X-High) SOTA puanını %90,5 olarak doğruladık ve görev başına 11,64 $ ile Bu, bir yılda ~390 kat verimlilik artışını temsil eder
Ayrıca GPT-5.2 Pro (Yüksek) modelinin ARC-AGI-2 için SOTA olduğunu ve görev başına 15,72 dolar karşılığında %54,2 puan aldığını doğruladık (API zaman aşımları nedeniyle, ARC-AGI-2'de GPT 5.2 Pro X-High'ı güvenilir şekilde doğrulayamadık) Tüm doğrulanmış GPT-5.2 aile puanları:
ARC-AGI, 2019 hedefine ulaşıyor: yapay zekayı ezberlemenin ötesine doğru verimli anında uyarlamaya doğru ilerletmek Akıl yürütme sistemleri artık basit görevlerde gerçek akışkan zeka sergiliyor
Bu büyük verimlilik artışına rağmen, insanlara karşı büyük bir fark kalıyor 2025 Büyük Ödül hedefi görev başına 0,20 dolardı ve insanlar enerji bazında birkaç kat daha verimli ARC-AGI-1 ve ARC-AGI-2'den hâlâ öğrenilecek çok şey var
ARC-AGI-3 (2026), yapay zeka kapasitesini ve verimliliğini daha da artıracak Yapay zekanın yenilikçi ortamlarda verimli öğrenme ve genelleme yeteneğini ölçmek için tasarlanan bu eser, türünün ilk örneği olan Etkileşimli Akıl Yürütme Kıyası olacak Takipte kalın
Eğer birkaç ayda yapay zekanın sınırlarını test eden yüzlerce yeni oyun göndermek heyecan verici geliyorsa, ARC-AGI-3'ü yaratan mühendislik ekibine katılın
44,54K