ChatGPT در آزمون های مجوز پزشکی ایالات متحده گذرانده است: مطالعه

این مطالعه گفت که ChatGPT همچنین از عملکرد PubMedGPT، یک مدل مشابه که به طور انحصاری بر روی ادبیات حوزه زیست‌پزشکی آموزش دیده بود، فراتر رفت و در مجموعه داده‌های قدیمی‌تری از سوالات به سبک USMLE، 50.8 درصد امتیاز کسب کرد.

“ChatGPT کمک قابل توجهی به نوشتن آن کرد [our] دست‌نوشته… ما با ChatGPT بسیار شبیه به یک همکار تعامل داشتیم، و از آن می‌خواستیم که پیش‌نویس‌های در دست اجرا را ترکیب، ساده‌سازی و ارائه کند… همه نویسندگان مشارکت به ورودی ChatGPT اهمیت می‌دادند.”

به عنوان مثال، آنها اضافه کردند، پزشکان در AnsibleHealth در حال حاضر از ChatGPT برای بازنویسی گزارش های اصطلاحات سنگین برای درک راحت تر بیمار استفاده می کنند.

این مطالعه گفت که تیفانی کونگ و همکارانش در AnsibleHealth، کالیفرنیا، ایالات متحده، عملکرد ChatGPT را در USMLE آزمایش کردند، مجموعه ای بسیار استاندارد و تنظیم شده از سه امتحان، شامل مراحل 1، 2CK، و 3، که برای صدور مجوز پزشکی در ایالات متحده لازم است.

ChatGPT یک سیستم هوش مصنوعی (AI) جدید است که به عنوان یک مدل زبان بزرگ (LLM) شناخته می‌شود، که برای تولید نوشتاری شبیه انسان با پیش‌بینی توالی کلمات آینده طراحی شده است.

کونگ افزود که نقش ChatGPT در این تحقیق فراتر از موضوع مطالعه است.

این مطالعه گفت در عوض، متن را با استفاده از روابط کلمه پیش بینی شده توسط فرآیندهای داخلی آن تولید می کند.

طبق این مطالعه، ChatGPT همچنین 94.6 درصد تطابق را در تمام پاسخ‌های خود نشان داد و حداقل یک بینش مهم را ایجاد کرد، چیزی که برای 88.9 درصد از پاسخ‌هایش جدید، غیر واضح و معتبر بود.

آستانه عبور در هر سال تقریباً 60 درصد است.

نویسندگان می‌گویند: «دستیابی به نمره قبولی برای این آزمون تخصصی دشوار، و انجام این کار بدون هیچ گونه تقویت انسانی، نقطه عطف قابل توجهی در بلوغ هوش مصنوعی بالینی است.»

نویسندگان دریافتند که پس از حذف پاسخ های نامشخص، ChatGPT در سه آزمون USMLE بین 52.4 تا 75 درصد امتیاز کسب کرده است، مطالعه منتشر شده در مجله PLOS Digital Health نشان می دهد.

پیوندهای وابسته ممکن است به طور خودکار ایجاد شوند – برای جزئیات بیشتر به بیانیه اخلاقی ما مراجعه کنید.

منبع

USMLE که توسط دانشجویان پزشکی و پزشکان در حال آموزش انجام می‌شود، دانشی را که بیشتر رشته‌های پزشکی را شامل می‌شود، از بیوشیمی گرفته تا استدلال تشخیصی و اخلاق زیستی ارزیابی می‌کند.

بر خلاف اکثر ربات‌های چت، ChatGPT نمی‌تواند در اینترنت جستجو کند.

پس از غربالگری برای حذف سوالات مبتنی بر تصویر از USMLE، نویسندگان این نرم افزار را روی 350 سوال از 376 سوال عمومی موجود در نسخه ژوئن 2022 USMLE آزمایش کردند.

طبق یک مطالعه جدید، ChatGPT می‌تواند حدود ۶۰ درصد از آستانه قبولی برای آزمون مجوز پزشکی ایالات متحده (USMLE) را با پاسخ‌هایی که منسجم، حس درونی و حاوی بینش‌های مکرر دارند، کسب کند.

در حالی که اندازه ورودی نسبتاً کوچک عمق و دامنه تجزیه و تحلیل‌ها را محدود می‌کرد، نویسندگان خاطرنشان کردند که یافته‌های آنها نگاهی اجمالی به پتانسیل ChatGPT برای افزایش آموزش پزشکی و در نهایت، عملکرد بالینی ارائه می‌دهد.