我恳请学术界研究使用前沿模型的AI能力。 本研究中使用的模型(将被引用多年作为“AI在健康建议方面表现不佳”的证据)是GPT-4o、Llama 3和Command R+,两个过时的模型和一个我从未听说过的模型。
@GlennMatlin @allen_ai @percyliang @AiEleuther @mbzuai 以及在研究健康建议等方面,这显然对消费者行为有影响,我认为你真的需要研究那些被广泛使用的模型。
187