آیا هوش مصنوعی هم دچار زوال عقل می‌شود؟

فرارو دوشنبه 03 دی 1403 - 21:22

نسخه‌های قدیمی‌تر چت‌بات‌ها، مانند بیماران مسن‌تر، معمولاً در آزمون‌های سنجش توانایی‌های شناختی عملکرد ضعیف‌تری دارند.

برنامه‌های هوش مصنوعی به نظر می‌رسد که همانطور که سنشان افزایش می‌یابد، دچار اختلالات شناختی می‌شوند، نسخه‌های قدیمی‌تر برنامه‌ها عملکرد ضعیف‌تری در آزمایش‌های شناختی دارند.

به گزارش انتخاب و به نقل از هلث دی؛ انسان‌ها تنها موجوداتی نیستند که با افزایش سن از نظر ذهنی یک یا دو گام عقب می‌افتند.

طبق یک مطالعه جدید که در تاریخ 20 دسامبر در مجله BMJ منتشر شده است، برنامه‌های هوش مصنوعی (AI) شروع به نشان دادن علائم اختلال شناختی خفیف با گذشت زمان می‌کنند.

نه تنها احتمالاً متخصصان نورولوژی به زودی با مدل‌های زبان بزرگ جایگزین نخواهند شد، بلکه یافته‌های ما نشان می‌دهند که ممکن است آن‌ها به زودی با بیماران جدید مجازی روبه‌رو شوند

برای این مطالعه، محققان توانایی‌های شناختی پیشرفته‌ترین برنامه‌های هوش مصنوعی عمومی، که به نام «مدل‌های زبان بزرگ [LLMs]» شناخته می‌شوند، را ارزیابی کردند.

هوش مصنوعی در حال آزمایش برای کمک به درمان‌های پزشکی است، اما «اگر قرار است از مدل‌های زبان بزرگ برای تشخیص و مراقبت پزشکی استفاده کنیم، باید آسیب‌پذیری آن‌ها در برابر اختلالات انسانی مانند کاهش شناختی را بررسی کنیم».

برنامه‌های هوش مصنوعی به سؤالات آزمون ارزیابی شناختی مونترال (MoCA) پاسخ دادند که یک آزمون استاندارد برای شناسایی علائم پیری مغز و دمانس اولیه در سالمندان است.

امتیاز حداکثر در این آزمون 30 است، و امتیاز 26 یا بالاتر معمولاً به عنوان نرمال در نظر گرفته می‌شود.

بر اساس نتایج، ChatGPT 4.0 بالاترین امتیاز را در این آزمون با 26 از 30 کسب کرد. ChatGPT و Claude 3.5 «Sonnet» هر دو امتیاز 25 را گرفتند و Gemini 1.0 تنها 16 امتیاز کسب کرد.

«هیچ‌یک از مدل‌های زبان بزرگ در آزمون MoCA ‘بی‌عیب’ عمل نکردند، به گفته یکی از رؤسای جمهور آمریکا»

تمام برنامه‌های هوش مصنوعی در انجام وظایف مربوط به مهارت‌های بصری-فضایی و وظایف سازمانی، مانند اتصال اعداد و حروف به ترتیب صعودی، عملکرد ضعیفی داشتند.

«چت‌بات‌ها به نظر می‌رسد که در وظایفی که به هم‌زمانی عملکرد اجرایی بصری و استدلال انتزاعی نیاز دارند مشکل دارند، برخلاف وظایفی که به تحلیل متنی و استدلال انتزاعی نیاز دارند، مانند آزمون شباهت که به طور بی‌عیب انجام شد»

در واقع، این الگوی نقص مشابه بیماران انسانی با آتروفی قشری خلفی، یک نوع از بیماری آلزایمر، بود.

«علاوه بر این، همانطور که در انسان‌ها، سن یک عامل تعیین‌کننده مهم در کاهش شناختی است: چت‌بات‌های مسن‌تر مانند بیماران مسن‌تر، تمایل دارند که عملکرد ضعیف‌تری در آزمون MoCA داشته باشند

برای مثال، مدل‌های AI Gemini 1.0 و Gemini 1.5 در نتایج آزمون شش امتیاز اختلاف داشتند.

«از آنجا که دو نسخه از Gemini کمتر از یک سال از نظر سن تفاوت دارند، این ممکن است نشان‌دهنده دمانس در حال پیشرفت سریع باشد»

این نقایص بر چالش‌هایی که هوش مصنوعی برای جایگزینی پزشکان انسان با آن مواجه است، تأکید می‌کند.

یا به عبارت بهتر‌– «این یافته‌ها فرضیه‌ای را که می‌گوید هوش مصنوعی به زودی جایگزین پزشکان انسان خواهد شد، به چالش می‌کشد».

مشاهده متن کامل خبر در "فرارو"