З'ясувати, якого елемента не вистачає, виявилося неможливим для всіх ЛМ, а для людей це досить тривіально.
В цілому, я вважаю думки GPT-5 найбільш корисними з деякими дуже конкретними питаннями, які у мене виникли про Silksong. Я бачив набагато менше галюцинацій у порівнянні з тим, коли я використовував O3 під час гри в Blue Prince.
Клод і Близнюки зазнали повної невдачі, Грок деякий час думав і давав безглузді відповіді (обидва пункти, про які він згадує, можна побачити на картині).
Оновлення: GPT-5 Pro насправді вирішив це правильно. Я вражений. Модель мислення щоразу помилялася.
5,8K