هوش مصنوعی

معرفی هوش مصنوعی Kling O1؛ یک مدل جامع برای تولید و ویرایش ویدیو

مدل نوین ویدیوساز Kling O1 به بازار عرضه شده است؛ این هوش مصنوعی چینی به طرز شگفت‌انگیزی بر خلاف سایر رقبا که ابزارهای مجزایی برای هر یک از وظایف (تولید، ویرایش، تغییر لباس) دارند، همه امکانات را در یک مدل متمرکز کرده است. به عبارت دیگر، با یک دستور ساده، تنوعی از عملکردها را از جمله ساخت و ویرایش و تغییر شخصیت ویدیو به دست خواهید آورد.

ویژگی بارز Kling O1 در طراحی اساس آن نهفته است که به نام MVL (زبان بصری چندبعدی) شناخته می‌شود. در حالی که ابزارهای موجود برای تجزیه و تحلیل متن، تصویر و ویدیو از الگوریتم‌های مجزا بهره می‌برند، Kling O1 این ورودی‌ها را در یک «فضای استدلالی یکپارچه» ادغام می‌کند.

این مدل قادر است به‌طور هم‌زمان متن، تصویر، ویدیو و حتی حرکات را تحلیل کند. نتیجه این یکپارچگی چیست؟ شما دیگر نیازی به سوئیچ کردن میان ابزارهای مختلف ندارید؛ تمام فرایندهای تولید، ویرایش، گسترش و تغییر استایل ویدیو تنها در یک مرحله توسط هوش مصنوعی انجام می‌شود.

معرفی مدل هوش مصنوعی ویدیوساز Kling O1

این مدل از منعطف‌ترین سیستم‌های انتقال تصویر به ویدیو در سطح جهانی به شمار می‌آید. هدف آن تبدیل ایده‌های انتزاعی به صحنه‌های سینمایی با ثبات و کیفیت بالا است. با استفاده از Kling O1 می‌توانید تا ۷ تصویر مرجع را بارگذاری کنید تا هوش مصنوعی بتواند به‌طور دقیق کاراکتر، لباس یا محیط مورد نظر را در ویدیو حفظ کند.

علاوه بر این، با آپلود فریم آغازین و پایانی، هوش مصنوعی مسیر حرکت بین این دو نقطه را به نرمی و با حفظ شخصیت‌ها ترسیم می‌کند. البته مدت زمان ویدیوها به حداکثر ۱۰ ثانیه محدود است. همچنین، می‌توانید با استفاده از دستور متنی، شخصیت ویدیو را تغییر دهید یا لباس او را عوض کنید.

بخش ویرایش Kling O1 جایی است که قدرت واقعی موتور تجمیع این هوش مصنوعی به نمایش گذاشته می‌شود. دیگر نیازی به ماسک‌گذاری فریم به فریم نیست. شما می‌توانید با یک فرمان متنی ساده تغییرات مختلفی را اجرا کنید: به سادگی هر شیء، فرد یا پس‌زمینه‌ای را در چند ثانیه حذف یا اضافه نمایید.

علاوه بر این موارد، می‌توانید یک ویدیوی مرجع را بارگذاری کنید تا Kling O1 حرکت دوربین و ریتم آن را استخراج کرده و روی صحنه جدید شما پیاده‌سازی کند؛ قابلیت جذاب این ویژگی را در ویدیوی زیر مشاهده نمایید:

بزرگ‌ترین چالش‌هایی که مدل‌های هوش مصنوعی ویدیویی با آن مواجه هستند، معمولاً به عدم ثبات برمی‌گردد؛ به این معنا که چهره کاراکتر در طول ویدیو دچار تغییر می‌شد. اما Kling O1 ثبات بی‌نظیری در چهره، لباس و اشیاء ارائه می‌دهد. این ویژگی به کارگردانان این امکان را می‌دهد که استوری‌بوردهای متحرک خلق کرده و صحنه‌های مختلف فیلم خود را آزمایش نمایند.

به تازگی نیز مدل ویدیوساز Runway Gen-4.5 معرفی شده که در آزمون‌های مختلف، موفق به کسب امتیازاتی بالاتر از مدل‌های ارائه شده توسط گوگل و OpenAI شده است.

مقالات مرتبط

دکمه بازگشت به بالا