🚨 قمت بتحليل 2,847 ورقة حول السلامة الذكاء الاصطناعي من 2020 إلى 2024. 94٪ من الاختبارات على نفس 6 اختبارات. الأسوأ: يمكنني تعديل سطر واحد من الكود والحصول على "أحدث التقنيات" في جميع الستة — دون تحسين السلامة الفعلية. البحث الأكاديمي في الذكاء الاصطناعي هو p-hacking منهجي. إليك كيف يتم كسر الملعب بالكامل: