Jag ber akademiker att studera AI-förmågor med hjälp av Frontier-modeller. modellerna som används i denna studie (som kommer att citeras i åratal som bevis på att "AI är dålig på hälsoråd") är GPT-4o, Llama 3 och Command R+, två föråldrade modeller och en jag aldrig hört talas om.
@GlennMatlin @allen_ai @percyliang @AiEleuther @mbzuai och om saker som att forska i hälsoråd, vilket har uppenbara konsumentbeteendeimplikationer, tycker jag att man verkligen behöver studera de modeller som används i stor utsträckning
200