我經常將我在 x 上看到的愚蠢或有爭議的內容發送給不同的 LLMs,以查看它們的反應。這裡出現了一個模式: Claude 4 幾乎總是假設有惡意,並拒絕參與或解釋,即使我可能真的不知道這篇帖子在說什麼。 GPT-5 通常會回應,但答案聽起來總是非常居高臨下和居心叵測。它經常拒絕參與核心論點。 Grok 4 感覺最開放。它接受最不理智的想法,並提出有趣的類比,而答案聽起來並不像一場講座。