به نظر میرسد شرکت چینی دیپسیک بهزودی مدل هوش مصنوعی جدیدی به نام R2 را معرفی خواهد کرد. اطلاعات فاششده نشان میدهد این مدل میتواند بار دیگر بازارهای جهانی هوش مصنوعی را تحتتأثیر قرار دهد؛ زیرا 97 درصد ارزانتر از GPT-4 خواهد داشت.
اولین مدل دیپسیک، R1، بهخوبی نشان داد چین در توسعه مدلهای پیشرفته هوش مصنوعی چیزی از رقبای غربی کم ندارد. عرضه مدل R1 بهقدری تأثیرگذار بود که میلیاردها دلار از ارزش بازار سهام آمریکا کاست و ثابت کرد توسعه مدلهای پیشرفته الزاماً نیاز به هزینههای هنگفتی که شرکتهایی مثل OpenAI اعلام کردهاند، ندارد. حالا شایعات درباره مدل جدید R2 خبر از پیشرفتهای چشمگیرتری میدهد.
گفته میشود DeepSeek R2 از معماری پیشرفته MoE (ترکیب متخصصان) بهره خواهد برد که احتمالاً با مکانیزمهای دروازهبندی مدرن یا ترکیبی از لایههای MoE و لایههای چگال طراحی شده تا پردازشهای سنگین را بهتر مدیریت کند. تعداد پارامترهای R2 حدود یکتریلیون و 200 میلیارد خواهد بود که دوبرابر R1 است. این رقم آن را در کنار مدلهای مطرحی چون GPT-4 Turbo و جمینای 2.0 پرو گوگل قرار میدهد.
نکته مهمتر این است که طبق گزارشها، هزینه هر میلیون توکن ورودی در DeepSeek R2 فقط 0.07 دلار و هزینه هر میلیون توکن خروجی حدود 0.27 دلار خواهد بود که 97 درصد ارزانتر از GPT-4 است. این موضوع میتواند DeepSeek R2 را به یکی از مقرونبهصرفهترین گزینههای موجود برای شرکتها و سازمانها تبدیل کند و در معادلات اقتصادی هوش مصنوعی تغییری جدی ایجاد کند.
از سوی دیگر، گفته میشود R2 با استفاده از تراشههای Ascend 910B هواوی آموزش داده شده و توانسته به 82 درصد بهرهوری از این خوشه تراشهها دست یابد. قدرت پردازشی این خوشه در دقت FP16 به 512 پتافلاپس میرسد نشان میدهد دیپسیک موفق شده کامل از منابع داخلی خود بهره ببرد و زنجیره تأمینش را عمودی یکپارچه کند.
هرچند باید در نظر داشت این اطلاعات هنوز رسمی تأیید نشدهاند، اگر این شایعات صحت داشته باشند، DeepSeek R2 میتواند بار دیگر معادلات بازار هوش مصنوعی را تغییر دهد و غافلگیری بزرگی برای رقبای غربی رقم بزند.