توانایی هوش مصنوعی در پزشکی: بین تئوری و عمل، از موفقیت تا شکست
«تجارتنیوز» گزارش میدهد:
ChatGPT توانست در سال 2022 برخی از آزمونهای پزشکی ایلات متحده را با موفقیت پشت سر بگذارد. امسال تیمی از متخصصان پزشکی کانادایی، عملکرد این هوش مصنوعی را تشخیصهای پزشکی بررسی کردند تا مشخص شود که آیا این ابزار در واقعیت هم عملکرد خوبی دارد؟ پاسخ منفی بود.
به گزارش تجارت نیوز،
امریت کرپالانی، معلم پزشکی دانشگاه وسترن کانادا که رهبری این تحقیق را به عهده داشت، گفت: «منبع سوالات پزشکی ما بانک سئوالات Medscape بود.» او اضافه کرد که آزمون USMLE که ChatGPT قبلا به آن پاسخ داده بود، عمدتا شامل سئوالات چند گزینهای است، اما Medscape آزمونی دارای پروندههای پزشکی بیماران واقعی است که یافتههای معاینه فیزیکی، نتایج آزامایشهای آزمایشگاهی و چند مورد دیگر هم پوشش میدهد.
از ChatGPT تا AMIE؛ آینده هوش مصنوعی در پزشکی
تیم کرپالانی 150 مورد از پروندههای Medscape را به پرسشهایی که ChatGPT بتواند درک و پردازش کند، تبدیل کردند. این پروندهها بهخاطر مواردی مثل چندین بیماری همزمان و معضلات تشخیص، برای پزشکان پیچیده بود. این آزمون بهخاطر محدودیت OpenAI، شرکت سازنده ChatGPT، در مشاورههای پزشکی، کمی با چالش مواجه شد، اما این محدودیتها با گفتن اینکه این تشخیصها برای مقالهای دانشگاهی است، به راحتی دور زده شد. سپس، تیم تحقیقاتی از این هوش مصنوعی خواست تا دلیلهای خود را برای این تشخیصها ارائه دهد. در نهایت مشخص شد که ChatGPT در 76 مورد از 150 پرونده، اشتباه کرد.
گوگل در ابتدای سال 2024، مطالعهای درباره AMIE، هوش مصنوعیای که براساس مکالمات بیماران به طور خاص برای تشخیص بیماریها طراحی شده است، منتشر کرد. AMIE در 303 پرونده از مجله پزشکی نیوانگلند و کنفرانس کلینیکوپاتولوژیک موفق شد تا از پزشکان انسانی پیشی بگیرد. این هوش مصنوعی، استثنائی نیست؛ سال گذشته، تقریبا هر هفته تحقیقاتی درمورد عملکرد شگفتانگیز هوش مصنوعیهای متفاوت در تشخیص سرطان و دیابت و حتی پیشبینی ناباروری مردان براساس آزمایشات خون منتشر میشد.
تفاوت ChatGPT و هوش مصنوعیهای تخصصی پزشکی در دادههایی است که با آن آموزش دیدهاند. کرپالانی گفت: «چنین هوش مصنوعیهایی ممکن است با حجم زیادی از ادبیات پزشکی و موارد پیچیده مشابه آموزش دیده باشند. ممکن است آنها برای درک اصطلاحات پزشکی، تفسیر آزمایشهای تشخیصی و شناسایی الگوهای دادههای پزشکی که به بیماریها یا شرایط خاص مربوط میشود، طراحی شده باشند. در مقابل، مدلهای زبان عمومی، مثل ChatGPT بر روی طیف گستردهای از موضوعات آموزش دیده و فاقد تخصص عمیق مورد نیاز برای تشخیص پزشکی هستند.» او افزود: «ChatGPT از دانش پزشکی دقیق بیاطلاع است و هر زمان که نتایج آزمایش حتی کمی خارج از محدوده نرمال باشد، منحرف میشود.»
یک دلیل جدی درمورد اینکه چرا بیشتر هوش مصنوعیهای پزشکی مثل AMIE دردسترس عموم نیستند، این است که وقتی اشتباه میکنند، روش ChatGPT را درپیش میگیرند. آنها سعی دارند که مخاطب را متقاعد کنند که درست میگویند. این در حالی است که جواب نیمی از پاسخهای ChatGPT اشتباه و با این حال، دلایل پاسخهای ارائهشده، بسیار خوب بود. کرپالانی گفت: «این موضوع هم جالب و هم نگرانکننده بود. از یک سو، این ابزار در سادهسازی توضیحات موضوعات پیچیده بسیار موثر است. از سوی دیگر، در صورت اشتباه میتواند بسیار متقاعدکننده باشد، چرا که موضوعات را به طرز قابل فهمی توضیح میدهد.»
ابزار کمکی یا جایگزین پزشکان؟
اکثر هوش مصنوعیها درکی از موضوعیکه درموردش صحبت میکنند، ندارند. تنها کاری که انجام میدهند، پیشبینی کلمه بعدی جمله براساس آموزشهایی که دیدهاند، است. به همین دلیل اکثر چتباتها حتی برای موارد غلط، استدلالهای بسیار قانعکننده، ساختاریافته و خوب نوشتهشدهای ارائه میدهند. هیچ راه آسانی برای ساخت یک پزشک هوش مصنوعی قابل اعتماد وجود ندارد. کرپالانی گفت: «این ابزارها باید در مقیاس بزرگ و بر روی دادههای بالینی آموزش داده شوند و در مسیر هم نیاز به نظارتهای زیادی خواهند داشت. ممکن است ChatGPT و ابزارهای مشابه برخی وظایف را انجام دهند، اما تشخیص موارد پیچیده نیاز به دقت فراوانی دارد.»
کرپالانی باور دارد که هوش مصنوعی تشخیص کامل یا مدیریت پزشکی را انجام نخواهد داد، بلکه ابزاری درخدمت پزشکان انسانی برای تقویت کارشان خواهد بود.
اخبار حوزه استارتاپ و فناوری اطلاعات را در صفحه استارتاپ تجارتنیوز بخوانید.