لقد اجتاز آخر تحديث لـ OpenAI لنموذج اللغة الكبير (LLM)، ChatGPT-4.0، اختبارًا لعلم الأعصاب السريري بإجابات صحيحة بنسبة 85% في دراسة إثبات المفهوم. يعتقد مؤلفو البحث أنه بعد بعض الضبط الدقيق، يمكن أن يكون لدى ماجستير إدارة الأعمال “تطبيقات مهمة” في علم الأعصاب السريري.
تم نشر نتائج التجربة، التي أجراها مجموعة من الباحثين من مستشفى جامعة هايدلبرغ ومركز أبحاث السرطان الألماني في هايدلبرغ، في 7 ديسمبر. الاختبار الذي تم إجراؤه في 31 مايو، شمل اثنين من حاملي شهادة الماجستير في القانون، ChatGPT-3.5 ومكوناته. الإصدار الأحدث، ChatGPT-4.0.
استخدم الباحثون بنك الأسئلة لامتحان علم الأعصاب من المجلس الأمريكي للطب النفسي والأعصاب مع مجموعة صغيرة من الأسئلة من المجلس الأوروبي لطب الأعصاب.
متعلق ب: يتم الآن اتهام العرض التوضيحي لـ Gemini من Google بأنه “مزيف”
في حين أن الإصدار الأقدم من ChatGPT سجل 66.8%، حيث أجاب على 1306 سؤالًا من أصل 1956 سؤالًا بشكل صحيح، فإن النموذج الأحدث، ChatGPT-4.0، حصل على 85% مع 1662 إجابة صحيحة. وكان متوسط النتيجة البشرية 73.8٪. تفوق ChatGPT-4.0 على المستخدمين البشريين في الأسئلة السلوكية والمعرفية والنفسية ونجح بشكل فعال في اختبار علم الأعصاب، حيث تعتبر 70% من الإجابات الصحيحة بشكل عام درجة النجاح في المؤسسات التعليمية.
ومع ذلك، أظهر كلا النموذجين أداءً أضعف في المهام التي تتطلب “تفكيرًا عالي المستوى” مقارنةً بالمسائل التي تتطلب “تفكيرًا منخفض المستوى” فقط.
وفقًا لمجموعة الباحثين الذين أجروا التجربة، فإن هذه النتائج بمثابة توصية لاستخدام ماجستير إدارة الأعمال في علم الأعصاب السريري بعد بعض التعديلات:
“تشير هذه النتائج إلى أنه مع مزيد من التحسينات، يمكن أن يكون لنماذج اللغة الكبيرة تطبيقات مهمة في علم الأعصاب السريري.”
ويشير الباحثون إلى أنه لا تزال هناك عدة تحفظات. في حين أن هناك منظور واضح لتطبيق LLMs في التوثيق وأنظمة دعم اتخاذ القرار، يجب على أطباء الأعصاب توخي الحذر بشأن استخدامها في الممارسة العملية، لأنها لا تزال غير كاملة فيما يتعلق بالمهام المعرفية عالية الترتيب. وفي حديثه إلى كوينتيليغراف، قال أحد مؤلفي الدراسة، الدكتور فارون فينكاتاراماني:
“نحن نرى دراستنا كدليل على مفهوم قدرات حاملي شهادة الماجستير في القانون. لا تزال هناك حاجة إلى التطوير وربما حتى الضبط الدقيق للماجستير في إدارة الأعمال لجعلها قابلة للتطبيق بشكل صحيح في علم الأعصاب السريري.
يعمل الذكاء الاصطناعي بالفعل على بعض المهام الرئيسية في مجال الرعاية الصحية، مثل العثور على علاج للسرطان لشركة أسترازينيكا أو مكافحة الإفراط في وصف المضادات الحيوية في هونغ كونغ.
مجلة: الخوف والشك لدى المشرعين هو الدافع وراء لوائح العملة المشفرة المقترحة في الولايات المتحدة













