شرکت Stability AI از هوش مصنوعی تولید ویدیو خود رونمایی کرد + ویدیو
شرکت Stability AI از مدل هوش مصنوعی جدیدی تحت عنوان Stable Video Diffusion رونمایی کرده است که با متحرک سازی تصاویر می تواند ویدیو تولید کند. Stable Video Diffusion براساس مدل متن به تصویر فعلی Stable Diffusion ساخته شده است و یکی از معدود مدل های تولیدکننده ویدیو محسوب می شود که به صورت باز ارائه شده است.
Stable Video Diffusion در حال حاضر طبق گفته Stability به عنوان نسخه «پیش نمایش تحقیقاتی» توصیف شده است و کسانی که قصد استفاده از آن را دارند باید با شرایط خاصی موافقت کنند. همچنین این مدل در دو شکل با عناوین SVD و SVDXT ارائه می شود. اولین مورد (SVD) تصاویر ثابت را به ویدیوهای 14 فریم 1024 در 576 پیکسل تبدیل می کند و هرچند SVDXT از معماری یکسانی بهره می برد، اما می تواند ویدیوهایی با 24 فریم تولید کند.
عملکرد هوش مصنوعی Stable Video Diffusion
هر دو مدل Stable Video Diffusion در ابتدا روی مجموعه داده ای متشکل از میلیون ها ویدیو آموزش داده شده اند و سپس تنظیم دقیق آن ها براساس مجموعه ای بسیار کوچک تر از صدها هزار تا حدود یک میلیون ویدیو انجام شده است.
البته Stable Video Diffusion با محدودیت هایی همراه است. به عنوان مثال، ویدیوهای تولیدشده توسط آن نسبتاً کوتاه هستند (زیر 4 ثانیه) و خروجی آن واقع گرایی کاملی را ارائه نمی کنند. همچنین این مدل ممکن است ویدیوهای بدون حرکت یا با حرکت بسیار آهسته دوربین تولید کند و نمی توان آن را از طریق متن کنترل کرد. بااین حال، این مدل در روزهای اولیه خود قرار دارد، و Stability AI مدعی شده که از آن می توان در مواردی از جمله ایجاد نمایش های 360 درجه ای استفاده کرد.
Stability AI در حال برنامه ریزی برای تولید مدل های مختلفی است که روی SVD و SVDXT ساخته می شوند و Stable Video Diffusion کاربردهای بالقوه ای در زمینه «تبلیغات، آموزش، سرگرمی و فراتر از آن » خواهد داشت. این شرکت اخیراً 25 میلیون دلار سرمایه گذاری دریافت کرده است تا مجموع سرمایه گذاری های انجام شده روی آن به بیش از 125 میلیون دلار برسد.