گوگل از مدل هوش مصنوعی Gemini رونمایی کرد؛ رقیب سرسخت GPT-4
مدیرعامل گوگل میگوید عرضه مدل هوش مصنوعی جمینای (Gemini) آغازگر عصر جدیدی برای این شرکت خواهد بود که از آن بهعنوان «عصر جمینای» نام برده شده است. این مدل در نسخههای مختلفی عرضه خواهد شد و میخواهد بهطور مستقیم به رقابت با GPT-4 از شرکت OpenAI برود.
گوگل اولینبار در رویداد توسعهدهندگان 2023 خود به مدل هوش مصنوعی جمینای اشاره کرده بود و حالا رسماً از عرضه آن خبر داده است. این مدل یک نسخه سبک بهنام Gemini Nano دارد که میتواند بهصورت آفلاین روی دستگاههای اندرویدی اجرا شود.
مدل دوم قدرت بیشتری دارد و با نام Gemini Pro بهزودی در سرویسهای هوش مصنوعی گوگل پیادهسازی خواهد شد و از امروز در چتبات بارد فعال میشود. نسخه سوم جمینای با نام Gemini Ultra، قدرتمندترین مدل زبانی بزرگی است که گوگل تابهحال خلق کرده و ظاهراً بیشتر برای دیتاسنترها و کاربردهای سازمانی طراحی شده است.
مدل هوش مصنوعی جمینای پرو در حال حاضر در بارد پیادهسازی میشود، و کاربران پیکسل 8 پرو هم میتوانند با جمینای نانو از ویژگیهای جدیدی برخوردار شوند. جمینای اولترا قرار است از سال آینده میلادی عرضه شود. توسعهدهندگان و مصرفکنندگان سازمانی میتوانند از 13 دسامبر از طریق Generative AI Studio یا Vertex AI در گوگل کلود به جمینای پرو دسترسی پیدا کنند.
مدل هوش مصنوعی Gemini گوگل در حال حاضر فقط به زبان انگلیسی در دسترس است و سایر زبانها در آینده برای آن فعال میشود. «ساندار پیچای»، مدیرعامل گوگل میگوید این مدل در نهایت در موتور جستجو، سرویس تبلیغات، مرورگر کروم و دیگر محصولات این شرکت پیادهسازی خواهد شد. این مدل آینده گوگل را رقم خواهد زد.
مقایسه مدل هوش مصنوعی Gemini با GPT-4
«دمیس هاسابیس»، مدیرعامل دیپمایند که در توسعه Gemini نقش اساسی داشته است، میگوید آنها بنچمارکهای زیادی را روی این مدل انجام دادهاند. در واقع از بین 32 بنچمارک مهمی که روی جمینای انجام شده است، این مدل در 30 مورد جلوتر از رقبا بوده است.
آشکارترین برتری جمینای در بنچمارکها به توانایی درک و تعامل با صوت و ویدیو برمیگردد. قابلیت چندوجهی ظاهراً از ابتدا یکی از اهداف توسعه جمینای بوده و گوگل قصد نداشته است تا مانند OpenAI برای امور مختلف مدلهای مختلفی مثل DALL-E یا Whisper بسازد.
جمینای نانو در حال حاضر فقط میتواند ورودی و خروجی متنی داشته باشد، اما نسخه قدرتمند آن یعنی اولترا قادر به کار با متن، تصویر، ویدیو و صدا است. هاسابیس میگوید در آینده قابلیتهای بیشتری مثل تشخیص لمس و حرکت هم توسط این مدل هوش مصنوعی قابل درک خواهد بود.
گوگل در زمینه کدنویسی ظاهراً تمرکز ویژهای روی جمینای داشته است. این مدل هوش مصنوعی از سیستم تولید کد جدید AlphaCode 2 استفاده میکند که این شرکت میگوید میتواند 85 درصد بهتر از رقبا و 50 درصد بهتر از نسل قبلی خود کدنویسی کند.
در حال بهروزرسانی…