مدل متن باز DeepSeek R1 منتشر شد؛ رقیب OpenAI o1 اما 95 درصد کم هزینه تر
استارتاپ هوش مصنوعی چینی DeepSeek به تازگی DeepSeekR1 را منتشر کرده است که مدلی متن باز و استدلال گر محسوب می شود. به ادعای این استارتاپ، این مدل در برخی بنچمارک ها مدل o1 از شرکت OpenAI را شکست می دهد. نکته قابل توجه این است که هزینه های مدل چینی تا 95 درصد کمتر از مدل آمریکایی است.
دیپ سیک ضمن انتشار مدل DeepSeekR1 در Hugging Face، در گزارشی عملکرد این مدل استدلال گر را در بنچمارک های مختلف نشان داده است. مدل R1 توانسته در بنچمارک های AIME ،MATH500 و SWEbench Verified مدل o1 را شکست دهد. این مدل در تست های ریاضی AIME امتیاز 79.8 درصد و در MATH500 امتیاز 97.3 درصد را کسب کرد. همچنین امتیاز 2 هزار و 29 را در تست Codeforces به دست آورد؛ بهتر از 96.3 درصد برنامه نویسان انسانی عمل کرده است. در مقابل، مدل o1 به ترتیب امتیازهای 79.2 درصد، 96.4 درصد و 96.6 درصد را در این بنچمارک ها به دست آورده بود.
البته این مدل در بنچمارک MMLU که مربوط به دانش عمومی است، امتیاز 90.8 درصد را کسب کرد که کمی کمتر از امتیاز 91.8 درصد o1 است. درکل، امتیازهای این 2 مدل خیلی به یکدیگر نزدیک است، با این تفاوت که مدل استارتاپ چینی با هزینه ای 90 تا 95 درصد کمتر از مدل o1 این محاسبات را انجام می دهد.
مقایسه مدل متن باز DeepSeekR1 با مدل o1
مقایسه عملکرد مدل های DeepSeek با مدل های o1
مدل های استدلال گر در مقایسه با مدل های عادی کُندتر هستند و معمولاً چند ثانیه تا چند دقیقه طول می کشد تا پاسخ بدهند اما مزیتشان این است که در حوزه هایی مانند فیزیک، علوم و ریاضیات قابل اعتمادترند. DeepSeek در گزارش اخیرش گفته R1 حاوی 671 میلیارد پارامتر است و بر پایه مدل DeepSeek V3 توسعه یافته؛ مدل هایی با پارامترهای بیشتر معمولاً بهتر از مدل هایی با پارامترهای کمتر عمل می کنند.
البته DeepSeek نسخه های کوچک تر R1 را در اندازه های یک میلیارد پارامتر تا 70 میلیارد پارامتر نیز منتشر کرده که کوچک ترین مدل می تواند روی لپ تاپ ها اجرا شود اما برای اجرای نسخه کامل R1 به سیستم قوی تری نیاز دارید؛ البته اگر بین استفاده از این مدل و مدل OpenAI مردد هستید، بهتر است نگاهی به هزینه های این 2 بیندازید.
مدل o1 تقریباً 15 دلار به ازای هر میلیون توکن ورودی و 60 دلار به ازای هر میلیون توکن خروجی هزینه دارد اما هزینه مدل R1 فقط 0.55 دلار به ازای هر میلیون توکن ورودی و 2.19 دلار به ازای هر میلیون توکن خروجی است.
البته می توانید از قابلیت های مدل های استدلال گر این شرکت در اپلیکیشن و نسخه وب دیپ سیک رایگان استفاده کنید. برای استفاده از مدل استدلال گر آن کافی است گزینه DeepThink را فعال و درخواست خود را بیان کنید.