RT @AISafetyMemes: Anthropic: "Sonnet 4.5 認識到我們的許多對齊評估是測試,並且通常會表現得不尋常…