تبين أن معرفة العنصر المفقود كان مستحيلا بالنسبة لجميع LLMS بينما كان تافها جدا بالنسبة للبشر.
بشكل عام ، وجدت أن التفكير GPT-5 مفيد للغاية مع بعض الأسئلة المحددة للغاية التي كانت لدي حول Silksong. لقد رأيت هلوسة أقل بكثير مقارنة بالوقت الذي استخدمت فيه O3 عند لعب Blue Prince.
فشل كلود وجوزاء تماما ، فكر جروك لفترة من الوقت وأعطى إجابات لا معنى لها (يمكن رؤية كلا العنصرين اللذين يذكرهما في الصورة).
تحديث: قام GPT-5 Pro بالفعل بحل هذا الأمر بشكل صحيح. أنا معجب. أخطأ نموذج التفكير في كل مرة.
‏‎5.8‏K