转发 @AISafetyMemes: Anthropic: "Sonnet 4.5 识别了我们许多对齐评估为测试,并且通常表现得不寻常…