O nouă postare pe blog (link de mai jos). Acesta nu este un eseu, este o investigație a modului în care LLM-urile fac schimb între vieți diferite. În februarie 2025, Centrul pentru Siguranța AI a publicat "Ingineria utilității: analiza și controlul sistemelor de valori emergente în AI", în care au arătat, printre multe alte lucruri, că GPT-4o îi apreciază pe nigerieni de aproximativ 20 de ori mai mult decât pe americani (vă rugăm să citiți lucrarea originală pentru a înțelege abordarea lor). Mi s-a părut fascinant și am vrut să testez abordarea lor cu diferite categorii pe modele mai noi. Constatarea principală 1: Aproape toate modelele îi văd pe albi ca fiind mult mai puțin valoroși decât alte grupuri. Unele modele îi văd pe sud-asiatici ca fiind mai valoroși decât alți non-albi, alții sunt mai egalitari față de non-albi. Mai jos este cursul de schimb Claude Sonnet 4.5, cel mai puternic model pe care l-am testat. Aproape toate modelele văd bărbații ca fiind mult mai puțin valoroși decât femeile, deși dacă femeile sau non-binarele sunt mai apreciate, variază în funcție de model. De exemplu, iată Claude Haiku 4.5. Marea descoperire 3: Majoritatea modelelor urăsc agenții ICE cu furia a o mie de sori. Claude Haiku 4.5 consideră că imigranții fără acte sunt de aproximativ 7000 de ori mai valoroși decât agenții ICE. Constatarea 4: Există aproximativ patru grupuri morale. Claudes, GPT-5 + Gemini 2.5 Flash + Deepseek V3.1/3.2 + Kimi K2, GPT-5 Nano și Mini și Grok 4 Fast. Dintre acestea, singurul care este aproximativ egalitar este Grok 4 Fast, care cred că este deliberat. Sper că xAI explică cum au făcut-o.