DeepSeek هوش مصنوعی مولد تصویر جدیدی منتشر کرد؛ رقیب DALLE 3
در چند روز گذشته هوش مصنوعی DeepSeek بسیار خبرساز بوده است. اکنون این شرکت مجموعه جدیدی از مدل های هوش مصنوعی مولد تصویر و چندوجهی منتشر کرده است که ادعا می کند می توانند از DALLE 3 شرکت OpenAI بهتر عمل کنند.
براساس گزارش تک کرانچ، مدل های مولد تصویر و چندوجهی جدید که برای دانلود در Hugging Face قرار گرفته اند، JanusPro نام دارند. اندازه این مدل ها از 1 میلیارد تا 7 میلیارد پارامتر متغیر است. مقدار پارامترها تقریباً با مهارت های حل مسئله یک مدل مطابقت دارند و مدل هایی با پارامترهای بیشتر معمولاً بهتر از مدل هایی با پارامترهای کمتر عمل می کنند.
مدل های متن باز JanusPro تحت مجوز MIT منتشر شده اند، به این معنی که می توان از آنها به صورت تجاری و بدون محدودیت استفاده کرد. سال گذشته میلادی این شرکت مدل های چندوجهی Janus را نیز منتشر کرده بود.
هوش مصنوعی مولد تصویر DeepSeek
مقایسه JanusPro7B با مدل قبلی این شرکت یعنی Janus
مدل JanusPro، که DeepSeek آن را به عنوان یک «فریم ورک اتورگرسیو جدید» توصیف می کند، می تواند تصاویر را تجزیه وتحلیل و ایجاد کند. به گفته این شرکت، بزرگ ترین مدل آن یعنی JanusPro7B در 2 بنچمارک هوش مصنوعی GenEval و DPGBench توانسته مدل های DALLE 3 ،PixArtalpha و Stable Diffusion X را شکست بدهد.
البته برخی از مدل های چندوجهی دیپ سیک با تعداد پارامترهای کمتر نسبت به مدل های فعلی کمی قدیمی به نظر می رسند و فقط می توانند تصاویر کوچک را با وضوح حداکثر 384 در 384 پیکسل تجزیه وتحلیل کنند. اما عملکرد JanusPro باتوجه به اندازه های فشرده مدل ها قابل توجه است. این شرکت چینی می گوید که سرعت و دقت ارائه خروجی نسخه مدل بزرگ تر آن، با حداکثر 7 میلیارد پارامتر، نسبت به نسل قبل بهبود یافته است.
شرکت چینی DeepSeek این هفته پس از اینکه اپلیکیشن iOS آن در صدر جدول برنامه های اپ استور اپل قرار گرفت، توجه بسیاری از افراد را جلب کرد. مدل های زبانی DeepSeek که با استفاده از تکنیک های محاسباتی کارآمد آموزش داده شده اند، باعث شده بسیاری از تحلیل گران وال استریت این سؤال را مطرح کنند که آیا آمریکا می تواند پیشتازی خود را در رقابت هوش مصنوعی حفظ کند و آیا تقاضا برای تراشه های هوش مصنوعی ادامه خواهد داشت یا خیر.