Ich bitte Akademiker dringend, die Fähigkeiten von KI mit Hilfe von Frontier-Modellen zu untersuchen. Die in dieser Studie verwendeten Modelle (die jahrelang als Beweis dafür zitiert werden, dass "KI schlecht bei Gesundheitsberatung ist") sind GPT-4o, Llama 3 und Command R+, zwei veraltete Modelle und eines, von dem ich noch nie gehört habe.
@GlennMatlin @allen_ai @percyliang @AiEleuther @mbzuai und bei Themen wie der Recherche von Gesundheitsratgebern, die offensichtliche Auswirkungen auf das Verbraucherverhalten haben, denke ich, dass man die Modelle, die weit verbreitet sind, wirklich studieren muss.
207