việc tìm ra món đồ nào bị thiếu hóa ra là điều không thể đối với tất cả các mô hình ngôn ngữ trong khi lại khá đơn giản đối với con người.
Tổng thể, tôi thấy việc suy nghĩ của gpt-5 rất hữu ích với một số câu hỏi rất cụ thể mà tôi có về silksong. Tôi đã thấy ít ảo giác hơn nhiều so với khi tôi sử dụng o3 khi chơi blue prince.
claude và gemini đã hoàn toàn thất bại, grok đã suy nghĩ một lúc và đưa ra những câu trả lời vô nghĩa (cả hai mục mà nó đề cập đều có thể thấy trong bức tranh).
cập nhật: gpt-5 pro thực sự đã giải quyết điều này đúng. tôi ấn tượng. mô hình tư duy đã sai mỗi lần.
6,27K