هوش مصنوعی بعدی دیپ سیک می تواند 97 درصد ارزان تر از GPT4 باشد
به نظر می رسد شرکت چینی دیپ سیک به زودی مدل هوش مصنوعی جدیدی به نام R2 را معرفی خواهد کرد. اطلاعات فاش شده نشان می دهد این مدل می تواند بار دیگر بازارهای جهانی هوش مصنوعی را تحت تأثیر قرار دهد؛ زیرا 97 درصد ارزان تر از GPT4 خواهد داشت.
اولین مدل دیپ سیک، R1، به خوبی نشان داد چین در توسعه مدل های پیشرفته هوش مصنوعی چیزی از رقبای غربی کم ندارد. عرضه مدل R1 به قدری تأثیرگذار بود که میلیاردها دلار از ارزش بازار سهام آمریکا کاست و ثابت کرد توسعه مدل های پیشرفته الزاماً نیاز به هزینه های هنگفتی که شرکت هایی مثل OpenAI اعلام کرده اند، ندارد. حالا شایعات درباره مدل جدید R2 خبر از پیشرفت های چشمگیرتری می دهد.
شایعات جدید درباره مدل هوش مصنوعی DeepSeek R2
گفته می شود DeepSeek R2 از معماری پیشرفته MoE (ترکیب متخصصان) بهره خواهد برد که احتمالاً با مکانیزم های دروازه بندی مدرن یا ترکیبی از لایه های MoE و لایه های چگال طراحی شده تا پردازش های سنگین را بهتر مدیریت کند. تعداد پارامترهای R2 حدود یک تریلیون و 200 میلیارد خواهد بود که دوبرابر R1 است. این رقم آن را در کنار مدل های مطرحی چون GPT4 Turbo و جمینای 2.0 پرو گوگل قرار می دهد.
نکته مهم تر این است که طبق گزارش ها، هزینه هر میلیون توکن ورودی در DeepSeek R2 فقط 0.07 دلار و هزینه هر میلیون توکن خروجی حدود 0.27 دلار خواهد بود که 97 درصد ارزان تر از GPT4 است. این موضوع می تواند DeepSeek R2 را به یکی از مقرون به صرفه ترین گزینه های موجود برای شرکت ها و سازمان ها تبدیل کند و در معادلات اقتصادی هوش مصنوعی تغییری جدی ایجاد کند.
از سوی دیگر، گفته می شود R2 با استفاده از تراشه های Ascend 910B هواوی آموزش داده شده و توانسته به 82 درصد بهره وری از این خوشه تراشه ها دست یابد. قدرت پردازشی این خوشه در دقت FP16 به 512 پتافلاپس می رسد نشان می دهد دیپ سیک موفق شده کامل از منابع داخلی خود بهره ببرد و زنجیره تأمینش را عمودی یکپارچه کند.
هرچند باید در نظر داشت این اطلاعات هنوز رسمی تأیید نشده اند، اگر این شایعات صحت داشته باشند، DeepSeek R2 می تواند بار دیگر معادلات بازار هوش مصنوعی را تغییر دهد و غافلگیری بزرگی برای رقبای غربی رقم بزند.