أظهرت دراسة نشرت في مجلة طب الأطفال التابعة للجمعية الطبية الأمريكية أن GPT-4 كان دقيقا بنسبة 17٪ فقط في تشخيص الحالات الطبية للأطفال ، بانخفاض عن 39٪ من الحالات الطبية العامة العام الماضي ، كما ذكرت Webmaster's House في 5 يناير. في الدراسة ، التي أجراها مركز كوهين الطبي للأطفال في نيويورك ، تم استخدام ChatGPT-4 لتحليل 100 حالة أطفال نشرتها JAMA Pediatrics و NEJM بين عامي 2013 و 2023. قام الباحثون بلصق نص الحالات ذات الصلة في مطالبات ChatGPT ، وتم تسجيل الإجابات التي تم إنشاؤها بواسطة الذكاء الاصطناعي من قبل باحثين طبيين مؤهلين. كان لدى ChatGPT 17 تشخيصا صحيحا فقط من أصل 100 حالة ، و 72 تشخيصا خاطئا ، و 11 حالة لم يتم فيها التقاط التشخيص بالكامل. من بين هؤلاء ، يتركز 57٪ من التشخيصات الخاطئة في نفس الجهاز العضوي. يظهر معدل النجاح المنخفض هذا حقيقة أنه من غير المرجح أن يفقد أطباء الأطفال وظائفهم في فترة زمنية قصيرة ، وتسلط الدراسة الضوء على الطبيعة التي لا يمكن الاستغناء عنها للتجربة السريرية في المجال الطبي. وأشار الباحثون إلى أن معدل الخطأ المرتفع في ChatGPT يرجع أساسا إلى عدم تحديده لعلاقات المرض ، واقترحوا أنه يمكن تحسين دقة النموذج من خلال التدريب الانتقائي على الأدبيات الطبية الدقيقة والموثوقة ، بالإضافة إلى توفير المزيد من البيانات الطبية في الوقت الفعلي.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
أظهرت دراسة نشرت في مجلة طب الأطفال التابعة للجمعية الطبية الأمريكية أن GPT-4 كان دقيقا بنسبة 17٪ فقط في تشخيص الحالات الطبية للأطفال ، بانخفاض عن 39٪ من الحالات الطبية العامة العام الماضي ، كما ذكرت Webmaster's House في 5 يناير. في الدراسة ، التي أجراها مركز كوهين الطبي للأطفال في نيويورك ، تم استخدام ChatGPT-4 لتحليل 100 حالة أطفال نشرتها JAMA Pediatrics و NEJM بين عامي 2013 و 2023. قام الباحثون بلصق نص الحالات ذات الصلة في مطالبات ChatGPT ، وتم تسجيل الإجابات التي تم إنشاؤها بواسطة الذكاء الاصطناعي من قبل باحثين طبيين مؤهلين. كان لدى ChatGPT 17 تشخيصا صحيحا فقط من أصل 100 حالة ، و 72 تشخيصا خاطئا ، و 11 حالة لم يتم فيها التقاط التشخيص بالكامل. من بين هؤلاء ، يتركز 57٪ من التشخيصات الخاطئة في نفس الجهاز العضوي. يظهر معدل النجاح المنخفض هذا حقيقة أنه من غير المرجح أن يفقد أطباء الأطفال وظائفهم في فترة زمنية قصيرة ، وتسلط الدراسة الضوء على الطبيعة التي لا يمكن الاستغناء عنها للتجربة السريرية في المجال الطبي. وأشار الباحثون إلى أن معدل الخطأ المرتفع في ChatGPT يرجع أساسا إلى عدم تحديده لعلاقات المرض ، واقترحوا أنه يمكن تحسين دقة النموذج من خلال التدريب الانتقائي على الأدبيات الطبية الدقيقة والموثوقة ، بالإضافة إلى توفير المزيد من البيانات الطبية في الوقت الفعلي.