برنامههای هوش مصنوعی به نظر میرسد که همانطور که سنشان افزایش مییابد، دچار اختلالات شناختی میشوند، نسخههای قدیمیتر برنامهها عملکرد ضعیفتری در آزمایشهای شناختی دارند.
به گزارش انتخاب و به نقل از هلث دی؛ انسانها تنها موجوداتی نیستند که با افزایش سن از نظر ذهنی یک یا دو گام عقب میافتند.
طبق یک مطالعه جدید که در تاریخ 20 دسامبر در مجله BMJ منتشر شده است، برنامههای هوش مصنوعی (AI) شروع به نشان دادن علائم اختلال شناختی خفیف با گذشت زمان میکنند.
نسخههای قدیمیتر چتباتها، مانند بیماران مسنتر، معمولاً در آزمونهای سنجش تواناییهای شناختی عملکرد ضعیفتری دارند.
نه تنها احتمالاً متخصصان نورولوژی به زودی با مدلهای زبان بزرگ جایگزین نخواهند شد، بلکه یافتههای ما نشان میدهند که ممکن است آنها به زودی با بیماران جدید مجازی روبهرو شوند
برای این مطالعه، محققان تواناییهای شناختی پیشرفتهترین برنامههای هوش مصنوعی عمومی، که به نام «مدلهای زبان بزرگ [LLMs]» شناخته میشوند، را ارزیابی کردند.
هوش مصنوعی در حال آزمایش برای کمک به درمانهای پزشکی است، اما «اگر قرار است از مدلهای زبان بزرگ برای تشخیص و مراقبت پزشکی استفاده کنیم، باید آسیبپذیری آنها در برابر اختلالات انسانی مانند کاهش شناختی را بررسی کنیم».
برنامههای هوش مصنوعی به سؤالات آزمون ارزیابی شناختی مونترال (MoCA) پاسخ دادند که یک آزمون استاندارد برای شناسایی علائم پیری مغز و دمانس اولیه در سالمندان است.
امتیاز حداکثر در این آزمون 30 است، و امتیاز 26 یا بالاتر معمولاً به عنوان نرمال در نظر گرفته میشود.
بر اساس نتایج، ChatGPT 4.0 بالاترین امتیاز را در این آزمون با 26 از 30 کسب کرد. ChatGPT و Claude 3.5 «Sonnet» هر دو امتیاز 25 را گرفتند و Gemini 1.0 تنها 16 امتیاز کسب کرد.
«هیچیک از مدلهای زبان بزرگ در آزمون MoCA ‘بیعیب’ عمل نکردند، به گفته یکی از رؤسای جمهور آمریکا»
تمام برنامههای هوش مصنوعی در انجام وظایف مربوط به مهارتهای بصری-فضایی و وظایف سازمانی، مانند اتصال اعداد و حروف به ترتیب صعودی، عملکرد ضعیفی داشتند.
«چتباتها به نظر میرسد که در وظایفی که به همزمانی عملکرد اجرایی بصری و استدلال انتزاعی نیاز دارند مشکل دارند، برخلاف وظایفی که به تحلیل متنی و استدلال انتزاعی نیاز دارند، مانند آزمون شباهت که به طور بیعیب انجام شد»
در واقع، این الگوی نقص مشابه بیماران انسانی با آتروفی قشری خلفی، یک نوع از بیماری آلزایمر، بود.
«علاوه بر این، همانطور که در انسانها، سن یک عامل تعیینکننده مهم در کاهش شناختی است: چتباتهای مسنتر مانند بیماران مسنتر، تمایل دارند که عملکرد ضعیفتری در آزمون MoCA داشته باشند
برای مثال، مدلهای AI Gemini 1.0 و Gemini 1.5 در نتایج آزمون شش امتیاز اختلاف داشتند.
«از آنجا که دو نسخه از Gemini کمتر از یک سال از نظر سن تفاوت دارند، این ممکن است نشاندهنده دمانس در حال پیشرفت سریع باشد»
این نقایص بر چالشهایی که هوش مصنوعی برای جایگزینی پزشکان انسان با آن مواجه است، تأکید میکند.
یا به عبارت بهتر– «این یافتهها فرضیهای را که میگوید هوش مصنوعی به زودی جایگزین پزشکان انسان خواهد شد، به چالش میکشد».