امتیاز هوش مصنوعی اوپن‌ای‌آی اشتباه از آب درآمد

دنیای اقتصاد سه شنبه 02 اردیبهشت 1404 - 00:03
مهر: اختلافی بین نتایج آزمایش مدل هوش مصنوعی o3 اوپن‌ای‌آی در بنچمارک طرف اول و ثالث سوالاتی درباره شفافیت این شرکت و روش‌های تست مدل‌های آن به وجود آورده است.

 به گزارش تک‌کرانچ، اوپن‌ای‌آی هنگام رونمایی این مدل را در دسامبر ۲۰۲۴ میلادی مدعی شد o۳ می‌تواند بیش از یک‌چهارم سوالات در بنچمارک FrontierMath (مجموعه‌ای چالش‌برانگیز از مساله‌های ریاضی) را پاسخ دهد. مارک چن، محقق ارشد اوپن‌ای‌آی، در یک برنامه پخش زنده گفت: «امروز تمام محصولات ارائه شده در بنچمارک FrontierMath کمتر از دو درصد امتیاز دارند. ما در تست‌های داخلیo۳ که در محیط‌های رایانشی با عملکرد بالا انجام شد، به امتیاز بیش از ۲۵ درصد دست یافتیم.

به نظر می‌رسد این رقم احتمالا حد بالایی بود که توسط نسخه‌ای از o۳ با محاسبات بیشتر نسبت به مدل OpenAI که هفته گذشته به‌طور عمومی عرضه شد، به دست آمد. انستیتو تحقیقات Epoch AI که بنچمارک FrontierMath را ارائه می‌کند، نتایج تست‌های مستقل خود از o۳ را منتشر کرد. این شرکت متوجه شد امتیاز این مدل حدود ۱۰ درصد و بسیار پایین‌تر از ارقام بسیار بالای ادعا شده توسط اوپن‌ای‌آی است.

منبع خبر "دنیای اقتصاد" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.