هوش مصنوعی

گوگل از مدل هوش مصنوعی Gemini رونمایی کرد؛ رقیب سرسخت GPT-4


مدیرعامل گوگل می‌گوید عرضه مدل هوش مصنوعی جمینای (Gemini) آغازگر عصر جدیدی برای این شرکت خواهد بود که از آن به‌عنوان «عصر جمینای» نام برده شده است. این مدل در نسخه‌های مختلفی عرضه خواهد شد و می‌خواهد به‌طور مستقیم به رقابت با GPT-4 از شرکت OpenAI برود.

گوگل اولین‌بار در رویداد توسعه‌دهندگان 2023 خود به مدل هوش مصنوعی جمینای اشاره کرده بود و حالا رسماً از عرضه آن خبر داده است. این مدل یک نسخه سبک به‌نام Gemini Nano دارد که می‌تواند به‌صورت آفلاین روی دستگاه‌های اندرویدی اجرا شود.

مدل دوم قدرت بیشتری دارد و با نام Gemini Pro به‌زودی در سرویس‌های هوش مصنوعی گوگل پیاده‌سازی خواهد شد و از امروز در چت‌بات بارد فعال می‌شود. نسخه سوم جمینای با نام Gemini Ultra، قدرتمندترین مدل زبانی بزرگی است که گوگل تابه‌حال خلق کرده و ظاهراً بیشتر برای دیتاسنترها و کاربردهای سازمانی طراحی شده است.

مدل هوش مصنوعی جمینای پرو در حال حاضر در بارد پیاده‌سازی می‌شود، و کاربران پیکسل 8 پرو هم می‌توانند با جمینای نانو از ویژگی‌های جدیدی برخوردار شوند. جمینای اولترا قرار است از سال آینده میلادی عرضه شود. توسعه‌دهندگان و مصرف‌کنندگان سازمانی می‌توانند از 13 دسامبر از طریق Generative AI Studio یا Vertex AI در گوگل کلود به جمینای پرو دسترسی پیدا کنند.

مدل هوش مصنوعی Gemini گوگل در حال حاضر فقط به زبان انگلیسی در دسترس است و سایر زبان‌ها در آینده برای آن فعال می‌شود. «ساندار پیچای»، مدیرعامل گوگل می‌گوید این مدل در نهایت در موتور جستجو، سرویس تبلیغات، مرورگر کروم و دیگر محصولات این شرکت پیاده‌سازی خواهد شد. این مدل آینده گوگل را رقم خواهد زد.

مقایسه مدل هوش مصنوعی Gemini با GPT-4

«دمیس هاسابیس»، مدیرعامل دیپ‌مایند که در توسعه Gemini نقش اساسی داشته است، می‌گوید آن‌ها بنچمارک‌های زیادی را روی این مدل انجام داده‌اند. در واقع از بین 32 بنچمارک مهمی که روی جمینای انجام شده است، این مدل در 30 مورد جلوتر از رقبا بوده است.

آشکارترین برتری جمینای در بنچمارک‌ها به توانایی درک و تعامل با صوت و ویدیو برمی‌گردد. قابلیت چندوجهی ظاهراً از ابتدا یکی از اهداف توسعه جمینای بوده و گوگل قصد نداشته است تا مانند OpenAI برای امور مختلف مدل‌های مختلفی مثل DALL-E یا Whisper بسازد.

جمینای نانو در حال حاضر فقط می‌تواند ورودی و خروجی متنی داشته باشد، اما نسخه قدرتمند آن یعنی اولترا قادر به کار با متن، تصویر، ویدیو و صدا است. هاسابیس می‌گوید در آینده قابلیت‌های بیشتری مثل تشخیص لمس و حرکت هم توسط این مدل هوش مصنوعی قابل درک خواهد بود.

گوگل در زمینه کدنویسی ظاهراً تمرکز ویژه‌ای روی جمینای داشته است. این مدل هوش مصنوعی از سیستم تولید کد جدید AlphaCode 2 استفاده می‌کند که این شرکت می‌گوید می‌تواند 85 درصد بهتر از رقبا و 50 درصد بهتر از نسل قبلی خود کدنویسی کند.

در حال به‌روزرسانی…

مقالات مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا