هوش مصنوعی

هوش مصنوعی تازه علی‌بابا فرآیند ویرایش تصاویر را آسان‌تر می‌سازد + عکس

تیم هوش مصنوعی Qwen در علی‌بابا از مدل جدیدی به نام Qwen-Image Edit پرده‌برداری کرده است. این ابزار پیشرفته قابلیت انجام ویرایش‌های پیچیده را تنها با دریافت دستورات متنی ساده فراهم می‌کند و توانایی‌هایی دارد که پیش از این تنها توسط نرم‌افزارهای حرفه‌ای مانند فتوشاپ میسر بود. این مدل به شکل متن‌باز ارائه شده است.

قدرت Qwen-Image Edit به مدل پایه‌اش یعنی Qwen-Image برمی‌گردد که به خاطر قابلیت برجسته‌اش در تبدیل متون پیچیده به زبان‌های چینی و انگلیسی شناخته شده است. این مدل نوین از یک معماری پیشرفته با نام «رمزگذاری دوگانه» (Dual Encoding) استفاده می‌کند. به این ترتیب که تصویر ورودی به‌طور هم‌زمان به دو شاخه متفاوت از هوش مصنوعی ارسال می‌شود: یکی برای تحلیل مفهوم کلی صحنه و دیگری برای حفظ جزئیات بصری و سبک تصویر اصلی. چنین رویکردی به این مدل امکان می‌دهد تا دو نوع ویرایش کاملاً متفاوت را با دقتی شگفت‌انگیز به انجام برساند.

نوع اول ویرایش‌ها، ویرایش‌های معنایی نام دارد که در آن مفهوم کلی تصویر تغییر می‌کند اما هویت واقعی اشیا حفظ می‌شود. به عنوان نمونه، کاربران توانسته‌اند عکسی از شهر منهتن را به سبک اسباب‌بازی‌های لگو بازطراحی کنند یا یک تصویر را به شیوه انیمه‌های استودیو جیبلی نمایان سازند. نوع دوم، ویرایش‌های ظاهری نامیده می‌شود که تمرکز آن روی تغییرات دقیق و محلی است. در این حالت، بخش عمده تصویر بدون تغییر باقی مانده و تنها جزئیات خاص دستخوش تغییر می‌شود. نمونه‌های ارائه شده شامل حذف یک تار مو از روی پرتره، افزودن یک تابلوی تبلیغاتی با بازتاب دقیق آن در آب و یا تغییر رنگ یک حرف در یک تصویر متنی است.

هوش مصنوعی علی‌بابا برای ویرایش حرفه‌ای تصاویر

یکی از بارزترین قابلیت‌های این مدل، توانایی ویرایش متن‌های چینی و انگلیسی موجود در تصاویر است. کاربران می‌توانند به سادگی متون جدیدی به پوسترها یا تابلوها بیفزایند، متون قبلی را حذف نمایند یا آن‌ها را تغییر دهند، در حالی که فونت و سبک بنیادی متن حفظ می‌شود. این ویژگی به ویژه در ویرایش آثار خوشنویسی که نیاز به دقت بالا دارد، به خوبی خود را نشان داده است.

این مدل به صورت متن‌باز و تحت مجوز آپاچی ۲.۰ منتشر شده است. این به این معناست که شرکت‌ها و توسعه‌دهندگان می‌توانند آن را به‌طور رایگان دانلود کرده و بر روی سخت‌افزارهای خود نصب نمایند که این امر می‌تواند به کاهش قابل توجه هزینه‌های نرم‌افزارهای اختصاصی منجر گردد. همچنین، Qwen-Image Edit از طریق پلتفرم‌های مختلفی مانند Qwen Chat و Hugging Face یا API ابری علی‌بابا (با هزینه ۰.۰۴۵ دلار برای هر تصویر) برای عموم قابل دسترسی است.

مقالات مرتبط

دکمه بازگشت به بالا