🚨 OpenAI 的 o1 证明了通过在推理时让模型 "思考更久" 可以使模型更聪明,而不是训练更大的模型。 DeepSeek、谷歌、Anthropic 都在转向测试时计算。 训练战争已经结束。推理战争刚刚开始。 这是目前正在发生的范式转变: