Estou implorando aos acadêmicos que estudem capacidades de IA usando modelos de fronteira. os modelos usados neste estudo (que será citado por anos como prova de que "a IA é ruim em conselhos de saúde") são GPT-4o, Llama 3 e Command R+, dois modelos obsoletos e um que eu nunca ouvi falar.
@GlennMatlin @allen_ai @percyliang @AiEleuther @mbzuai e em coisas como pesquisar conselhos de saúde, que têm implicações óbvias no comportamento do consumidor, acho que você realmente precisa estudar os modelos amplamente usados
188