Nobitex Referral Campaign Banner

تازه‌های اقتصادی:

42 دقیقه پیش
عکاسی باشی ناصرالدین شاه، مالک این محله تهران بود
1 ساعت پیش
حمله هوایی آمریکا به مناطقی از صنعا و صعده یمن
1 ساعت پیش
وزیر دفاع فعلی آمریکا برکنار می‌شود؟
2 ساعت پیش
مخالفت صریح مصر و عربستان با کوچ اجباری از غزه
2 ساعت پیش
ترس تل‌آویو از روز جهانی خشم علیه اسرائیل/ هشدار به صهیونیست‌ها در سراسر جهان
2 ساعت پیش
وزیر امور خارجه: ایران اصلا قصد ندارد در ملأ عام مذاکره کند
2 ساعت پیش
اعتراض دوباره شهرک‌نشینان اسرائیلی علیه نتانیاهو
2 ساعت پیش
اسرار واردات بنز و بی‌ام‌و به ایران
2 ساعت پیش
«هانی‌ کرده» و «ممد طراح» بازداشت شدند!
2 ساعت پیش
وزیر اسرائیلی نتانیاهو را تهدید کرد
3 ساعت پیش
استفاده از طلای ۲۴ عیار در ساخت ماشین ۱۰ میلیاردی چینی
3 ساعت پیش
جنگنده‌های آمریکایی شهری در مرکز یمن را بمباران کردند
3 ساعت پیش
رشد بورس تنها آغاز ماجراست
3 ساعت پیش
پرواز شاخص در قله تاریخی
3 ساعت پیش
بررسی وضعیت بورس پس از رشد پرحجم اخیر
3 ساعت پیش
بازسازی بورس در 8 روز
3 ساعت پیش
۱۱۰ کشور منتظر «ایران‌اکسپو»
3 ساعت پیش
همه فرصت‌های طلای سیاه
3 ساعت پیش
تصویر روزانه صنایع بورسی - ۱۴۰۴/۰۲/۰۲
3 ساعت پیش
سردمداران ورود و خروج حقیقی‌ها - ۱۴۰۴/۰۲/۰۲
3 ساعت پیش
نبض شاخص - ۱۴۰۴/۰۲/۰۲
3 ساعت پیش
بازار سهام - ۱۴۰۴/۰۲/۰۲
3 ساعت پیش
صادرات زیر تیغ ارزی
3 ساعت پیش
ادامه‌ فیلترینگ بی‌تاثیر است
3 ساعت پیش
گذار جهانی به 5G و خاموشی شبکه‌های قدیمی
3 ساعت پیش
تدوین و اجرای نقشه راه توسعه شهری متوازن و مردم‏‏‌محور
3 ساعت پیش
هوش مصنوعی سیاراتی را که‌ می‌توانند میزبان حیات باشند، پیدا می‌کند

امتیاز هوش مصنوعی اوپن‌ای‌آی اشتباه از آب درآمد

دنیای اقتصاد سه شنبه 02 اردیبهشت 1404 - 00:03

مهر: اختلافی بین نتایج آزمایش مدل هوش مصنوعی o3 اوپن‌ای‌آی در بنچمارک طرف اول و ثالث سوالاتی درباره شفافیت این شرکت و روش‌های تست مدل‌های آن به وجود آورده است.

به گزارش تک‌کرانچ، اوپن‌ای‌آی هنگام رونمایی این مدل را در دسامبر ۲۰۲۴ میلادی مدعی شد o۳ می‌تواند بیش از یک‌چهارم سوالات در بنچمارک FrontierMath (مجموعه‌ای چالش‌برانگیز از مساله‌های ریاضی) را پاسخ دهد. مارک چن، محقق ارشد اوپن‌ای‌آی، در یک برنامه پخش زنده گفت: «امروز تمام محصولات ارائه شده در بنچمارک FrontierMath کمتر از دو درصد امتیاز دارند. ما در تست‌های داخلیo۳ که در محیط‌های رایانشی با عملکرد بالا انجام شد، به امتیاز بیش از ۲۵ درصد دست یافتیم.

به نظر می‌رسد این رقم احتمالا حد بالایی بود که توسط نسخه‌ای از o۳ با محاسبات بیشتر نسبت به مدل OpenAI که هفته گذشته به‌طور عمومی عرضه شد، به دست آمد. انستیتو تحقیقات Epoch AI که بنچمارک FrontierMath را ارائه می‌کند، نتایج تست‌های مستقل خود از o۳ را منتشر کرد. این شرکت متوجه شد امتیاز این مدل حدود ۱۰ درصد و بسیار پایین‌تر از ارقام بسیار بالای ادعا شده توسط اوپن‌ای‌آی است.

مشاهده متن کامل خبر در "دنیای اقتصاد"

آخرین اخبار

پربیننده ترین اخبار روز

آخرین اخبار استانها:

عناوین روزنامه‌های امروز:

جستجو:

پخش زنده اخبار:

تیتر اخبار - تیتر آخرین اخبار - آخرین اخبار روز - آخرین اخبار ایران - خبر - اخبار سیاسی - اخبار ورزشی - اخبار اقتصادی - اخبار فناوری - اخبار فرهنگی - اخبار هنری - اخبار پزشکی - اخبار حوادث - اخبار استانها

تمامی خبرها توسط نرم‌افزار جستجوگر خبر سایت گردآوری شده و سایت نگارآنلاین در قبال محتوای خبرها مسئولیتی ندارد

تمامی حقوق این سایت برای نگارآنلاین محفوظ است