معرفی هوش مصنوعی Kling O1؛ یک مدل جامع برای تولید و ویرایش ویدیو

مدل نوین ویدیوساز Kling O1 به بازار عرضه شده است؛ این هوش مصنوعی چینی به طرز شگفتانگیزی بر خلاف سایر رقبا که ابزارهای مجزایی برای هر یک از وظایف (تولید، ویرایش، تغییر لباس) دارند، همه امکانات را در یک مدل متمرکز کرده است. به عبارت دیگر، با یک دستور ساده، تنوعی از عملکردها را از جمله ساخت و ویرایش و تغییر شخصیت ویدیو به دست خواهید آورد.
ویژگی بارز Kling O1 در طراحی اساس آن نهفته است که به نام MVL (زبان بصری چندبعدی) شناخته میشود. در حالی که ابزارهای موجود برای تجزیه و تحلیل متن، تصویر و ویدیو از الگوریتمهای مجزا بهره میبرند، Kling O1 این ورودیها را در یک «فضای استدلالی یکپارچه» ادغام میکند.
این مدل قادر است بهطور همزمان متن، تصویر، ویدیو و حتی حرکات را تحلیل کند. نتیجه این یکپارچگی چیست؟ شما دیگر نیازی به سوئیچ کردن میان ابزارهای مختلف ندارید؛ تمام فرایندهای تولید، ویرایش، گسترش و تغییر استایل ویدیو تنها در یک مرحله توسط هوش مصنوعی انجام میشود.
معرفی مدل هوش مصنوعی ویدیوساز Kling O1
این مدل از منعطفترین سیستمهای انتقال تصویر به ویدیو در سطح جهانی به شمار میآید. هدف آن تبدیل ایدههای انتزاعی به صحنههای سینمایی با ثبات و کیفیت بالا است. با استفاده از Kling O1 میتوانید تا ۷ تصویر مرجع را بارگذاری کنید تا هوش مصنوعی بتواند بهطور دقیق کاراکتر، لباس یا محیط مورد نظر را در ویدیو حفظ کند.
علاوه بر این، با آپلود فریم آغازین و پایانی، هوش مصنوعی مسیر حرکت بین این دو نقطه را به نرمی و با حفظ شخصیتها ترسیم میکند. البته مدت زمان ویدیوها به حداکثر ۱۰ ثانیه محدود است. همچنین، میتوانید با استفاده از دستور متنی، شخصیت ویدیو را تغییر دهید یا لباس او را عوض کنید.
بخش ویرایش Kling O1 جایی است که قدرت واقعی موتور تجمیع این هوش مصنوعی به نمایش گذاشته میشود. دیگر نیازی به ماسکگذاری فریم به فریم نیست. شما میتوانید با یک فرمان متنی ساده تغییرات مختلفی را اجرا کنید: به سادگی هر شیء، فرد یا پسزمینهای را در چند ثانیه حذف یا اضافه نمایید.
علاوه بر این موارد، میتوانید یک ویدیوی مرجع را بارگذاری کنید تا Kling O1 حرکت دوربین و ریتم آن را استخراج کرده و روی صحنه جدید شما پیادهسازی کند؛ قابلیت جذاب این ویژگی را در ویدیوی زیر مشاهده نمایید:
بزرگترین چالشهایی که مدلهای هوش مصنوعی ویدیویی با آن مواجه هستند، معمولاً به عدم ثبات برمیگردد؛ به این معنا که چهره کاراکتر در طول ویدیو دچار تغییر میشد. اما Kling O1 ثبات بینظیری در چهره، لباس و اشیاء ارائه میدهد. این ویژگی به کارگردانان این امکان را میدهد که استوریبوردهای متحرک خلق کرده و صحنههای مختلف فیلم خود را آزمایش نمایند.
به تازگی نیز مدل ویدیوساز Runway Gen-4.5 معرفی شده که در آزمونهای مختلف، موفق به کسب امتیازاتی بالاتر از مدلهای ارائه شده توسط گوگل و OpenAI شده است.




