معرفی مدل نوین دیپ‌سیک؛ نصف کردن هزینه‌ها با طراحی تازه

مهر 8, 1404اخرین به روز رسانی: مهر 8, 1404

2 دقیقه خوانده شد

مدل جدید دیپ‌سیک معرفی شد؛ کاهش نیمی از هزینه‌ها با معماری جدید

استارتاپ چینی دیپ‌سیک به تازگی از مدلی نوین به نام DeepSeek-V3.2-Exp پرده‌برداری کرده است که به واسطه یک معماری جدید با عنوان «توجه پراکنده» نوید کاهش هزینه‌های تحلیلی هوش مصنوعی برای متون طولانی را تا نیمه می‌دهد. این نوآوری می‌تواند امکان بهره‌گیری از مدل‌های هوش مصنوعی با قدرت بالا را برای شرکت‌های کوچکتر فراهم سازد.

مدل‌های هوش مصنوعی کنونی برای تحلیل یک متن، نیازمند توجه به تمام کلمات و جملات آن هستند. این روند به ویژه در متون بلند، نیازمند منابع محاسباتی و هزینه‌های سروری بسیار بالاست. اما رویکرد جدید DeepSeek تحت عنوان «توجه پراکنده» (DSA) این معادله را دگرگون می‌سازد.

این سیستم به جای پردازش کل اطلاعات، به صورت هوشمندانه و گزینشی عمل می‌کند. تصور کنید که یک شرکت هواپیمایی به دنبال بهترین مسیر باشد؛ لذا به جای آنکه تمام مسیرهای ممکن را در سطح جهانی بررسی کند، تنها گزینه‌های منطقی را فیلتر می‌نماید. «توجه پراکنده» نیز به همین شیوه داده‌ها را تحلیل می‌کند. در گام اول، با یک ماژول هوشمند، مهم‌ترین بخش‌های متن شناسایی شده و سپس صرفاً کلمات یا توکن‌های کلیدی برای تجزیه و تحلیل نهایی می‌شوند. این فرآیند به شکل چشمگیری بار محاسباتی را کاهش می‌دهد و طبق ادعای دیپ‌سیک، قادر است هزینه استفاده از API را در سناریوهای شامل متن طولانی تا ۵۰ درصد تقلیل دهد.

معماری نوین دیپ‌سیک برای کاهش هزینه‌ها

<pبه نقل از CNBC، این پیشرفت خبر خوشی برای کل اکوسیستم فناوری به شمار می‌آید. کاهش قابل توجه هزینه‌ها بدین معناست که توسعه‌دهندگان، محققان و شرکت‌های کوچک‌تر که توانایی تامین هزینه‌های زیاد را ندارند، اکنون می‌توانند از مدل‌های قوی هوش مصنوعی برای ایجاد اپلیکیشن‌های خود بهره‌برداری کنند. این امر می‌تواند منجر به ایجاد موجی جدید از خلاقیت و رقابت در بازار شود.

با وجود تمام مزایای این رویکرد، یک نگرانی عمده نیز وجود دارد: قابلیت اعتماد. سوال اصلی اینجاست که هوش مصنوعی چگونه تشخیص می‌دهد که کدام داده‌ها اهمیت دارند و کدام‌یک بی‌اهمیت هستند؟

«اکاترینا آلماسک» (Ekaterina Almasque)، یکی از سرمایه‌گذاران بارز در حوزه هوش مصنوعی، بیان می‌کند: «واقعیت این است که این مدل‌ها بسیاری از ظرافت‌ها را نادیده می‌گیرند. سوال اساسی این است که آیا آن‌ها مکانیزم مناسبی برای حذف داده‌های غیرمهم دارند؟»

این مسئله از منظر ایمنی و فراگیر بودن هوش مصنوعی می‌تواند مشکلساز باشد. اگر مدلی به‌طور سیستماتیک داده‌های مرتبط با یک گروه خاص یا یک دیدگاه خاص را به عنوان «غیرمهم» شناسایی کند، خروجی آن ممکن است به شدت جانبدارانه، غیرقابل اعتماد و حتی خطرناک باشد.

مهر 8, 1404اخرین به روز رسانی: مهر 8, 1404

2 دقیقه خوانده شد

معرفی مدل نوین دیپ‌سیک؛ نصف کردن هزینه‌ها با طراحی تازه

معماری نوین دیپ‌سیک برای کاهش هزینه‌ها

شتاب‌دهنده پارالاکس در حال تدوین «گزارش چالش‌های صنعت بازی ایران» است

آموزش مدیریت موجودی Apple ID Balance؛ چطور دقیق بفهمیم چقدر اعتبار داریم؟

خرید یوسی پابجی موبایل با بهترین قیمت و تحویل فوری از واریا شاپ

بازی های 2026 PS5؛ منتظر چه عناوینی باشیم؟

خرید قسطی پلی‌استیشن ۵؛ راهی منطقی برای ورود به نسل نهم بازی‌ها بدون فشار مالی

مایکروسافت قابلیت «Copilot Mode» را به مرورگر Edge اضافه کرد

مدیر عامل ناشر GTA: هوش مصنوعی صرفاً یک «تردستی» محسوب می‌شود

احتمال انتشار بسته الحاقی مورد نظر برای بازی Silent Hill 2 Remake تقویت شد

این استاد ژاپنی از یک بازی ترسناک برای تدریس زبان در کنسول PS4 بهره می‌برد

پیشرفت محققان چینی؛ شبیه‌سازی شیمی کوانتومی به کمک ابرکامپیوتر کلاسیک

مادربرد Z890 AORUS Tachyon Ice از گیگابایت به رکورد جهانی DDR5-13010 دست یافت

بازگشت پورشه به استفاده از پیشرانه‌های بنزینی؛ کناره‌گیری از آرزوی خودروهای الکتریکی

معماری نوین دیپ‌سیک برای کاهش هزینه‌ها

خرید بی واسطه از فروشگاه‌ها به صورت چت

اپرا نسخه هوش مصنوعی Neon مرورگر خود را با اشتراک ماهیانه 20 دلار ارائه کرد + ویدیو

مقالات مرتبط

هوش مصنوعی DrugGPT برای کمک به تجویز دارو ساخته شد

هوش مصنوعی نوع جدیدی از یک گونه دیجیتالی است

تحریف اطلاعات با عناوین فریبنده

OpenAI هزینه های پردازشی مدل GPT3.5 Turbo را کاهش می دهد