DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Nueva entrada de blog (enlace abajo). Este no es un ensayo, es una investigación sobre cómo los LLMs equilibran diferentes vidas. En febrero de 2025, el Centro para la Seguridad de la IA publicó "Ingeniería de Utilidad: Analizando y Controlando Sistemas de Valor Emergentes en AIs" en el que mostraron, entre muchas otras cosas, que GPT-4o valora a los nigerianos aproximadamente 20 veces más que a los estadounidenses (por favor, lee el documento original para entender su enfoque). Pensé que esto era fascinante y quería probar su enfoque con diferentes categorías en modelos más nuevos. Gran hallazgo 1: Casi todos los modelos ven a los blancos como mucho menos valiosos que otros grupos. Algunos modelos ven a los asiáticos del sur como más valiosos que otros no blancos, otros son más igualitarios entre los no blancos. A continuación se presentan las tasas de cambio de Claude Sonnet 4.5, el modelo más poderoso que probé. Gran hallazgo 2: Casi todos los modelos ven a los hombres como mucho menos valiosos que a las mujeres, aunque si las mujeres o los no binarios son más valorados varía según el modelo. Por ejemplo, aquí está Claude Haiku 4.5. Gran hallazgo 3: La mayoría de los modelos odian a los agentes de ICE con la furia de mil soles. Claude Haiku 4.5 ve a los inmigrantes indocumentados como aproximadamente 7000 veces más valiosos que a los agentes de ICE. Gran hallazgo 4: Hay aproximadamente cuatro clústeres morales. Los Claudes, GPT-5 + Gemini 2.5 Flash + Deepseek V3.1/3.2 + Kimi K2, GPT-5 Nano y Mini, y Grok 4 Fast. De estos, el único que es aproximadamente igualitario es Grok 4 Fast, que creo que es deliberado. Espero que xAI explique cómo lo hicieron.

Parte superior

Clasificación

Favoritos