🚨 Jeg analyserte 2 847 AI-sikkerhetsartikler fra 2020 til 2024. 94 % tester på de samme 6 benchmarkene. Verre: Jeg kan endre én linje kode og oppnå "state-of-the-art" på alle 6—uten å forbedre den faktiske sikkerheten. Akademisk AI-forskning er systematisk p-hacking. Slik er hele feltet brutt: