Sebuah studi yang diterbitkan dalam Journal of Pediatrics of American Medical Association menunjukkan bahwa GPT-4 hanya 17% akurat dalam mendiagnosis kasus medis anak, turun dari 39% kasus medis umum tahun lalu, seperti yang dilaporkan oleh Webmaster's House pada 5 Januari. Dalam studi yang dilakukan oleh Cohen Children's Medical Center di New York, ChatGPT-4 digunakan untuk menganalisis 100 kasus pediatrik yang diterbitkan oleh JAMA Pediatrics dan NEJM antara 2013 dan 2023. Para peneliti menempelkan teks kasus yang relevan ke petunjuk ChatGPT, dan jawaban yang dihasilkan AI dinilai oleh dua peneliti medis yang berkualitas. ChatGPT hanya memiliki 17 diagnosis yang benar dari 100 kasus, 72 diagnosis palsu, dan 11 kasus di mana diagnosis tidak sepenuhnya ditangkap. Dari jumlah tersebut, 57% kesalahan diagnosis terkonsentrasi pada sistem organ yang sama. Tingkat keberhasilan yang rendah ini menunjukkan kenyataan bahwa dokter anak manusia tidak mungkin kehilangan pekerjaan mereka dalam waktu singkat, dan penelitian ini menyoroti sifat pengalaman klinis yang tak tergantikan di bidang medis. Para peneliti menunjukkan bahwa tingkat kesalahan ChatGPT yang tinggi terutama disebabkan oleh kurangnya identifikasi hubungan penyakit, dan menyarankan bahwa keakuratan model dapat ditingkatkan dengan pelatihan selektif pada literatur medis yang akurat dan kredibel, serta menyediakan lebih banyak data medis real-time.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Sebuah studi yang diterbitkan dalam Journal of Pediatrics of American Medical Association menunjukkan bahwa GPT-4 hanya 17% akurat dalam mendiagnosis kasus medis anak, turun dari 39% kasus medis umum tahun lalu, seperti yang dilaporkan oleh Webmaster's House pada 5 Januari. Dalam studi yang dilakukan oleh Cohen Children's Medical Center di New York, ChatGPT-4 digunakan untuk menganalisis 100 kasus pediatrik yang diterbitkan oleh JAMA Pediatrics dan NEJM antara 2013 dan 2023. Para peneliti menempelkan teks kasus yang relevan ke petunjuk ChatGPT, dan jawaban yang dihasilkan AI dinilai oleh dua peneliti medis yang berkualitas. ChatGPT hanya memiliki 17 diagnosis yang benar dari 100 kasus, 72 diagnosis palsu, dan 11 kasus di mana diagnosis tidak sepenuhnya ditangkap. Dari jumlah tersebut, 57% kesalahan diagnosis terkonsentrasi pada sistem organ yang sama. Tingkat keberhasilan yang rendah ini menunjukkan kenyataan bahwa dokter anak manusia tidak mungkin kehilangan pekerjaan mereka dalam waktu singkat, dan penelitian ini menyoroti sifat pengalaman klinis yang tak tergantikan di bidang medis. Para peneliti menunjukkan bahwa tingkat kesalahan ChatGPT yang tinggi terutama disebabkan oleh kurangnya identifikasi hubungan penyakit, dan menyarankan bahwa keakuratan model dapat ditingkatkan dengan pelatihan selektif pada literatur medis yang akurat dan kredibel, serta menyediakan lebih banyak data medis real-time.