Sebagai seorang akademisi, saya bersimpati karena penerbitan membutuhkan waktu lama dan sulit untuk mengikuti model perbatasan, tapi... ... terutama jika argumen Anda adalah "AI buruk di X" Anda perlu menjelaskan mengapa menurut Anda itu tidak akan berubah, grafik tren apa pun saat model meningkat & memperbarui sebelum publikasi
Kevin Roose
Kevin Roose13 jam lalu
Saya memohon akademisi untuk mempelajari kemampuan AI menggunakan model perbatasan. model yang digunakan dalam penelitian ini (yang akan dikutip selama bertahun-tahun sebagai bukti bahwa "AI buruk dalam saran kesehatan") adalah GPT-4o, Llama 3, dan Command R+, dua model usang dan satu yang belum pernah saya dengar.
Namun, makalah ini sebenarnya memiliki dua poin nyata yang besar: (1) Manusia buruk dalam mendorong AI (usang) untuk mendapatkan nasihat medis - saya menduga ini tidak lagi benar (2) Tolok ukur pengetahuan medis tidak selalu berarti kenyataan dalam melayani pasien. 1 telah berubah, saya pikir, 2 belum
212