Saya sering mengirim hal-hal bodoh atau kontroversial yang saya lihat di X ke LLM yang berbeda untuk melihat reaksi mereka. Pola ini telah muncul: Claude 4 hampir selalu mengasumsikan kebencian dan menolak untuk terlibat atau menjelaskan meskipun saya mungkin benar-benar tidak tahu apa yang dibicarakan posting itu. GPT-5 biasanya menanggapi tetapi jawabannya selalu terdengar sangat merendahkan dan menggurui. Ia sering menolak untuk terlibat dengan argumen inti. Grok 4 merasa paling berpikiran terbuka. Ini menghibur ide-ide yang paling tidak terkendali dan menarik analogi yang menarik tanpa jawabannya terdengar seperti ceramah.