هوش مصنوعی

معرفی Veo 3.1؛ بهبود در کیفیت تبدیل تصاویر به ویدیو + ویدیو

شرکت گوگل از نسخه جدید هوش مصنوعی خود به نام Veo 3.1 رونمایی کرده است که در تبدیل تصاویر به ویدیو، عملکرد بهتری را ارائه می‌دهد. این نسخه از دقت بیشتری در اجرای جزئیات درخواست‌های متنی برخوردار است و اکنون از طریق API جمینای به کاربران قابل دسترسی است. علاوه بر این، Veo 3.1 به عنوان موتور اصلی ویرایشگر ویدیوی Flow گوگل نیز شناخته می‌شود.

هوش مصنوعی تولید ویدیو Veo 3.1

Veo 3.1 بر پایه قابلیت‌هایی شکل گرفته که گوگل در رویداد Google I/O 2025 و هم‌زمان با انتشار Veo 3 به معرفی آنها پرداخت. به گفته گوگل، مدل جدید در «پاسخ‌دهی به درخواست‌های کاربر» بهینه شده است و اکنون می‌تواند با دقت بیشتری از تصاویر بارگذاری‌شده به همراه متن، ویدیو تولید نماید. علاوه بر این، برای نخستین بار، تبدیل تصویر به ویدیو همراه با تولید صدا به‌صورت هم‌زمان در Veo 3.1 ممکن شده که این ویژگی در نسخه قبلی موجود نبود.

ابزار Flow همچنین امکانات جدیدی را با Veo 3.1 تحت عنوان Frame to Video ارائه می‌دهد. این ویژگی به کاربران این امکان را می‌دهد که فریم آغازین و پایانی یک صحنه را آپلود کنند تا سیستم ویدیویی بین این دو فریم بسازد. گوگل اعلام کرده است که این ویژگی مشابه یک قابلیت در Adobe Firefly است، اما Flow به توانایی تولید هم‌زمان صدا نیز equipped است.

مهارت‌های صوتی نوین Veo همچنین در دیگر قابلیت‌های Flow، نظیر افزوده شدن صحنه به ویدیوهای موجود یا درج اشیاء در فریم‌ها، به کار گرفته می‌شود.

براساس نمونه‌های منتشرشده توسط گوگل، ویدیوهای تولیدشده با Veo 3.1 هنوز به‌نوعی حس مصنوعی دارند و کیفیت آنها بسته به مضمون و متن ورودی متفاوت است. اما با این حال، علی‌رغم فاصله از واقع‌گرایی مدل Sora 2 متعلق به شرکت OpenAI، رویکرد گوگل در متمرکز شدن بر کاربردهای حرفه‌ای و ویرایشی به جای تولید محتوای سطحی برای شبکه‌های اجتماعی، یک پیشرفت مثبت تلقی می‌شود.

مقالات مرتبط

دکمه بازگشت به بالا