معرفی Veo 3.1؛ بهبود در کیفیت تبدیل تصاویر به ویدیو + ویدیو

شرکت گوگل از نسخه جدید هوش مصنوعی خود به نام Veo 3.1 رونمایی کرده است که در تبدیل تصاویر به ویدیو، عملکرد بهتری را ارائه میدهد. این نسخه از دقت بیشتری در اجرای جزئیات درخواستهای متنی برخوردار است و اکنون از طریق API جمینای به کاربران قابل دسترسی است. علاوه بر این، Veo 3.1 به عنوان موتور اصلی ویرایشگر ویدیوی Flow گوگل نیز شناخته میشود.
هوش مصنوعی تولید ویدیو Veo 3.1
Veo 3.1 بر پایه قابلیتهایی شکل گرفته که گوگل در رویداد Google I/O 2025 و همزمان با انتشار Veo 3 به معرفی آنها پرداخت. به گفته گوگل، مدل جدید در «پاسخدهی به درخواستهای کاربر» بهینه شده است و اکنون میتواند با دقت بیشتری از تصاویر بارگذاریشده به همراه متن، ویدیو تولید نماید. علاوه بر این، برای نخستین بار، تبدیل تصویر به ویدیو همراه با تولید صدا بهصورت همزمان در Veo 3.1 ممکن شده که این ویژگی در نسخه قبلی موجود نبود.
ابزار Flow همچنین امکانات جدیدی را با Veo 3.1 تحت عنوان Frame to Video ارائه میدهد. این ویژگی به کاربران این امکان را میدهد که فریم آغازین و پایانی یک صحنه را آپلود کنند تا سیستم ویدیویی بین این دو فریم بسازد. گوگل اعلام کرده است که این ویژگی مشابه یک قابلیت در Adobe Firefly است، اما Flow به توانایی تولید همزمان صدا نیز equipped است.
مهارتهای صوتی نوین Veo همچنین در دیگر قابلیتهای Flow، نظیر افزوده شدن صحنه به ویدیوهای موجود یا درج اشیاء در فریمها، به کار گرفته میشود.
براساس نمونههای منتشرشده توسط گوگل، ویدیوهای تولیدشده با Veo 3.1 هنوز بهنوعی حس مصنوعی دارند و کیفیت آنها بسته به مضمون و متن ورودی متفاوت است. اما با این حال، علیرغم فاصله از واقعگرایی مدل Sora 2 متعلق به شرکت OpenAI، رویکرد گوگل در متمرکز شدن بر کاربردهای حرفهای و ویرایشی به جای تولید محتوای سطحی برای شبکههای اجتماعی، یک پیشرفت مثبت تلقی میشود.




