выяснить, какой предмет отсутствует, оказалось невозможным для всех llms, в то время как для людей это довольно тривиально.
в целом, я нашел, что мышление gpt-5 было наиболее полезным для некоторых очень конкретных вопросов, которые у меня были о silksong. Я заметил гораздо меньше галлюцинаций по сравнению с тем, когда я использовал o3, играя за синего принца.
клод и гемини полностью провалились, грок думал некоторое время и давал бессмысленные ответы (оба упомянутых элемента можно увидеть на картинке).
обновление: gpt-5 pro на самом деле решил это правильно. Я впечатлён. Модель мышления ошибалась каждый раз.
6,11K