1/ AI sprider sig inom finans-, företags- och konsumentappar Men vi upptäcker fortfarande "bra" agenter via statiska benchmarks och hype Inget av detta bevisar tillförlitlighet i verkliga sammanhang Träffsäkerhet bygger upp det förtroendelagret 🧵