رقیب فتوشاپ؛ نرمافزار ویرایش تصویر Nano Banana به مجموعه جمینای افزوده گردید

گوگل به تازگی از یک بهروزرسانی بزرگ و قدرتمند برای قابلیت ویرایش تصاویر جمینای رونمایی کرده است. این ارتقا که بهوسیله مدل Nano banana کار میکند، به کاربران این امکان را میدهد تا در ویرایش تصاویر کنترل بیشتری داشته باشند. بهویژه، این مدل مشکل حفظ ثبات چهره و جزئیات سوژهها در طول ویرایشهای متوالی را به طرز چشمگیری حل کرده است.
به نقل از گزارش تککرانچ، مدل جدید گوگل که بهطور رسمی Gemini 2.5 Flash Image نامیده میشود، پیش از معرفی آن تحت نام ناشناس Nano-Banana در پنل ارزیابی هوش مصنوعی LMArena دیده شده و با قابلیتهایش توانست تحسین کاربران و کارشناسان را برانگیزد. اکنون گوگل تأیید کرده است که این مدل ارزشمند، فناوری جدیدی است که در حال افزودن به جمینای است.
هوش مصنوعی ویرایش تصویر Nano Banana در جمینای گوگل
ارتقاء اصلی این تغییرات بر حل یکی از بزرگترین چالشهای هوش مصنوعی مولد تصویر متمرکز است: حفظ ثبات شخصیت. به این ترتیب، شما قادر خواهید بود که عکسهایی از دوستان، خانواده یا حتی حیوانات خانگی خود را ویرایش کنید، بدون اینکه نگران تغییر چهره یا ظاهر آنها در ویرایشهای متعدد باشید (مانند تغییر حالت مو، لباس یا کل صحنه). تمامی این جزئیات به صورت واقعی و ثابت خواهد ماند.
همچنین، ویژگیهای جدیدی به این مدل افزوده شده است که به کاربران اجازه میدهد تا چندین عکس را بهراحتی بارگذاری کرده و از هوش مصنوعی بخواهند که این تصاویر را در یک صحنه جدید و هماهنگ ترکیب کند. همچنین قابلتوجه است که میتوان الگوهای بصری یک تصویر (مثل الگوی گلی) را بر روی یک شی در تصویر دیگر اعمال کرد (به عنوان مثال، آن را به طراحی یک لباس تبدیل کرد). بعلاوه، کاربران قادرند به صورت مرحلهای و متوالی، اجزای مختلف یک تصویر را تغییر دهند و در این فرآیند ویرایشهای قبلی کماکان حفظ میشود.
این ارتقا در شرایطی صورت میگیرد که رقابت در بازار هوش مصنوعی به شدت در حال افزایش است. پس از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT موفق به جذب کاربران زیادی شد، گوگل نیز مصمم است با ارائه قابلیتهای قویتر، این فاصله را پر کند. در حال حاضر، ChatGPT بالغ بر ۷۰۰ میلیون کاربر هفتگی دارد، در حالی که جمینای به ۴۵۰ میلیون کاربر ماهانه دست یافته است.
گوگل همچنین با بهرهگیری از تجربیات گذشته (نظیر تولید تصاویر تاریخی نادرست) اقداماتی برای ایمنی محتوا اتخاذ کرده است. تمامی تصاویر تولید یا ویرایش شده با این ابزار جدید، دارای یک واترمارک قابل مشاهده و یک واترمارک نامرئی (SynthID) خواهند بود تا قابلیت شناسایی آنها از عکسهای واقعی آسانتر شود. به علاوه، قوانین سختگیرانهای به منظور جلوگیری از تولید محتوای مضر، از قبیل تصاویر خصوصی، وضع شده است.
این قابلیتهای جدید به تدریج برای تمام کاربران اپلیکیشن جمینای و همچنین برای توسعهدهندگان از طریق APIهای گوگل در دسترس خواهد بود.




