我懇求學術界研究使用前沿模型的AI能力。 這項研究中使用的模型(將被引用多年作為「AI在健康建議方面表現不佳」的證據)是GPT-4o、Llama 3和Command R+,兩個過時的模型和一個我從未聽過的模型。
@GlennMatlin @allen_ai @percyliang @AiEleuther @mbzuai 還有像是研究健康建議這類的東西,這顯然對消費者行為有影響,我認為你真的需要研究那些被廣泛使用的模型。
186