هوش مصنوعی

رقیب فتوشاپ؛ نرم‌افزار ویرایش تصویر Nano Banana به مجموعه جمینای افزوده گردید

گوگل به تازگی از یک به‌روزرسانی بزرگ و قدرتمند برای قابلیت ویرایش تصاویر جمینای رونمایی کرده است. این ارتقا که به‌وسیله مدل Nano banana کار می‌کند، به کاربران این امکان را می‌دهد تا در ویرایش تصاویر کنترل بیشتری داشته باشند. به‌ویژه، این مدل مشکل حفظ ثبات چهره و جزئیات سوژه‌ها در طول ویرایش‌های متوالی را به طرز چشم‌گیری حل کرده است.

به نقل از گزارش تک‌کرانچ، مدل جدید گوگل که به‌طور رسمی Gemini 2.5 Flash Image نامیده می‌شود، پیش از معرفی آن تحت نام ناشناس Nano-Banana در پنل ارزیابی هوش مصنوعی LMArena دیده شده و با قابلیت‌هایش توانست تحسین کاربران و کارشناسان را برانگیزد. اکنون گوگل تأیید کرده است که این مدل ارزشمند، فناوری جدیدی است که در حال افزودن به جمینای است.

هوش مصنوعی ویرایش تصویر Nano Banana در جمینای گوگل

ارتقاء اصلی این تغییرات بر حل یکی از بزرگ‌ترین چالش‌های هوش مصنوعی مولد تصویر متمرکز است: حفظ ثبات شخصیت. به این ترتیب، شما قادر خواهید بود که عکس‌هایی از دوستان، خانواده یا حتی حیوانات خانگی خود را ویرایش کنید، بدون اینکه نگران تغییر چهره یا ظاهر آن‌ها در ویرایش‌های متعدد باشید (مانند تغییر حالت مو، لباس یا کل صحنه). تمامی این جزئیات به صورت واقعی و ثابت خواهد ماند.

همچنین، ویژگی‌های جدیدی به این مدل افزوده شده است که به کاربران اجازه می‌دهد تا چندین عکس را به‌راحتی بارگذاری کرده و از هوش مصنوعی بخواهند که این تصاویر را در یک صحنه جدید و هماهنگ ترکیب کند. همچنین قابل‌توجه است که می‌توان الگوهای بصری یک تصویر (مثل الگوی گلی) را بر روی یک شی در تصویر دیگر اعمال کرد (به عنوان مثال، آن را به طراحی یک لباس تبدیل کرد). بعلاوه، کاربران قادرند به صورت مرحله‌ای و متوالی، اجزای مختلف یک تصویر را تغییر دهند و در این فرآیند ویرایش‌های قبلی کماکان حفظ می‌شود.

این ارتقا در شرایطی صورت می‌گیرد که رقابت در بازار هوش مصنوعی به شدت در حال افزایش است. پس از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT موفق به جذب کاربران زیادی شد، گوگل نیز مصمم است با ارائه قابلیت‌های قوی‌تر، این فاصله را پر کند. در حال حاضر، ChatGPT بالغ بر ۷۰۰ میلیون کاربر هفتگی دارد، در حالی که جمینای به ۴۵۰ میلیون کاربر ماهانه دست یافته است.

گوگل همچنین با بهره‌گیری از تجربیات گذشته (نظیر تولید تصاویر تاریخی نادرست) اقداماتی برای ایمنی محتوا اتخاذ کرده است. تمامی تصاویر تولید یا ویرایش شده با این ابزار جدید، دارای یک واترمارک قابل مشاهده و یک واترمارک نامرئی (SynthID) خواهند بود تا قابلیت شناسایی آن‌ها از عکس‌های واقعی آسان‌تر شود. به علاوه، قوانین سخت‌گیرانه‌ای به منظور جلوگیری از تولید محتوای مضر، از قبیل تصاویر خصوصی، وضع شده است.

این قابلیت‌های جدید به تدریج برای تمام کاربران اپلیکیشن جمینای و همچنین برای توسعه‌دهندگان از طریق APIهای گوگل در دسترس خواهد بود.

مقالات مرتبط

دکمه بازگشت به بالا