Tôi thường gửi những thứ ngớ ngẩn hoặc gây tranh cãi mà tôi thấy trên x đến các llm khác nhau để xem phản ứng của chúng. Một mẫu hình đã xuất hiện: Claude 4 gần như luôn giả định có ác ý và từ chối tham gia hoặc giải thích mặc dù tôi có thể thực sự không biết bài đăng đang nói về điều gì. GPT-5 thường phản hồi nhưng câu trả lời luôn nghe rất kiêu ngạo và bề trên. Nó thường từ chối tham gia vào lập luận cốt lõi. Grok 4 cảm thấy cởi mở nhất. Nó tiếp nhận những ý tưởng điên rồ nhất và đưa ra những phép so sánh thú vị mà không khiến câu trả lời nghe như một bài giảng.