هوش مصنوعی تازه علیبابا فرآیند ویرایش تصاویر را آسانتر میسازد + عکس
تیم هوش مصنوعی Qwen در علیبابا از مدل جدیدی به نام Qwen-Image Edit پردهبرداری کرده است. این ابزار پیشرفته قابلیت انجام ویرایشهای پیچیده را تنها با دریافت دستورات متنی ساده فراهم میکند و تواناییهایی دارد که پیش از این تنها توسط نرمافزارهای حرفهای مانند فتوشاپ میسر بود. این مدل به شکل متنباز ارائه شده است.
قدرت Qwen-Image Edit به مدل پایهاش یعنی Qwen-Image برمیگردد که به خاطر قابلیت برجستهاش در تبدیل متون پیچیده به زبانهای چینی و انگلیسی شناخته شده است. این مدل نوین از یک معماری پیشرفته با نام «رمزگذاری دوگانه» (Dual Encoding) استفاده میکند. به این ترتیب که تصویر ورودی بهطور همزمان به دو شاخه متفاوت از هوش مصنوعی ارسال میشود: یکی برای تحلیل مفهوم کلی صحنه و دیگری برای حفظ جزئیات بصری و سبک تصویر اصلی. چنین رویکردی به این مدل امکان میدهد تا دو نوع ویرایش کاملاً متفاوت را با دقتی شگفتانگیز به انجام برساند.
نوع اول ویرایشها، ویرایشهای معنایی نام دارد که در آن مفهوم کلی تصویر تغییر میکند اما هویت واقعی اشیا حفظ میشود. به عنوان نمونه، کاربران توانستهاند عکسی از شهر منهتن را به سبک اسباببازیهای لگو بازطراحی کنند یا یک تصویر را به شیوه انیمههای استودیو جیبلی نمایان سازند. نوع دوم، ویرایشهای ظاهری نامیده میشود که تمرکز آن روی تغییرات دقیق و محلی است. در این حالت، بخش عمده تصویر بدون تغییر باقی مانده و تنها جزئیات خاص دستخوش تغییر میشود. نمونههای ارائه شده شامل حذف یک تار مو از روی پرتره، افزودن یک تابلوی تبلیغاتی با بازتاب دقیق آن در آب و یا تغییر رنگ یک حرف در یک تصویر متنی است.
هوش مصنوعی علیبابا برای ویرایش حرفهای تصاویر
یکی از بارزترین قابلیتهای این مدل، توانایی ویرایش متنهای چینی و انگلیسی موجود در تصاویر است. کاربران میتوانند به سادگی متون جدیدی به پوسترها یا تابلوها بیفزایند، متون قبلی را حذف نمایند یا آنها را تغییر دهند، در حالی که فونت و سبک بنیادی متن حفظ میشود. این ویژگی به ویژه در ویرایش آثار خوشنویسی که نیاز به دقت بالا دارد، به خوبی خود را نشان داده است.
این مدل به صورت متنباز و تحت مجوز آپاچی ۲.۰ منتشر شده است. این به این معناست که شرکتها و توسعهدهندگان میتوانند آن را بهطور رایگان دانلود کرده و بر روی سختافزارهای خود نصب نمایند که این امر میتواند به کاهش قابل توجه هزینههای نرمافزارهای اختصاصی منجر گردد. همچنین، Qwen-Image Edit از طریق پلتفرمهای مختلفی مانند Qwen Chat و Hugging Face یا API ابری علیبابا (با هزینه ۰.۰۴۵ دلار برای هر تصویر) برای عموم قابل دسترسی است.