学者として、出版には時間がかかり、フロンティアモデルに追いつくのが難しいことに共感しますが... ...特に「AIはXが苦手だ」という主張なら、なぜ変わらないと思うのかを説明し、モデルの改善に伴う傾向をグラフ化し、公開前に更新する必要があります
Kevin Roose
Kevin Roose13時間前
私は学者たちにフロンティアモデルを使ったAI能力を研究するよう懇願しています。 この研究で使われているモデル(「AIは健康アドバイスが苦手だ」という証拠として何年も引用されるでしょう)は、GPT-4o、Llama 3、Command R+で、どちらも時代遅れで、私が聞いたこともないモデルです。
しかし、この論文には実際に二つの大きな本当のポイントがあります。 (1) 人間は(時代遅れの)AIに医療アドバイスを求めるのが下手だった - これは今やあまり当てはまらないのではないかと私は思います (2) 医学知識の基準が必ずしも患者に提供する現実を意味するわけではありません。 1は変わったと思いますが、2は変わっていません
213