هوش مصنوعی

شرکت OpenAI از نسخه جدید هوش مصنوعی ویدیو ساز به نام Sora 2 پرده برداشت

شرکت OpenAI به معرفی مدل ویدیوساز Sora 2 پرداخت. این مدل به لحاظ فیزیکی از دقت و واقع‌گرایی بیشتری برخوردار بوده و نسبت به نسخه‌های قبلی، مدیریت آن راحت‌تر است. همچنین این مدل قابلیت حمایت از دیالوگ‌ها و جلوه‌های صوتی همزمان با تصاویر را دارد.

آشنایی با مدل هوش مصنوعی ویدیوساز OpenAI Sora 2

طبق اطلاعاتی که از وب‌سایت OpenAI حاصل شده، این کمپانی عرضه نسخه اول Sora را با عرضه GPT-1 مقایسه کرده و نسخه Sora 2 را به عرضه GPT-3.5 شبیه دانسته است که تحولی بزرگ به شمار می‌رود. سازنده ChatGPT ادعا می‌کند که Sora 2 قادر است وظایفی را انجام دهد که برای مدل‌های قبلی به شدت دشوار و انجام آن‌ها غیرممکن محسوب می‌شدند.

نسخه‌های قبلی به‌طور ساده‌انگارانه عمل می‌کردند و برای اجرای دستورات متنی، واقعیت را به‌طور غیرواقعی تغییر می‌دادند. به‌عنوان مثال، اگر یک بازیکن بسکتبال موفق به پرتاب توپ به درون سبد نمی‌شد، توپ ممکن بود به‌طور ناگهانی به داخل سبد برسد. در حالی که در Sora 2، اگر اشتباهی رخ دهد، توپ به ناحیه تخته برخورد خواهد کرد.

OpenAI اذعان کرده است که هرچند Sora 2 هنوز برخی از نواقص را دارد، اما در زمینه پیروی از قوانین فیزیک به نحو قابل توجهی بهتر عمل می‌کند. این گام به سوی شبیه‌سازی واقعیت اهمیت بیشتری دارد، زیرا برای یادگیری از موفقیت‌ها و همچنین شکست‌ها باید الگوبرداری کرد.

مدل هوش مصنوعی ویدیوساز Sora 2 در زمینه کنترل‌پذیری پیشرفتی بزرگ به حساب می‌آید. این مدل توانایی دارد که بر اساس دستورالعمل‌های مشخص برای چندین شات عمل کند و همزمان وضعیت دنیای اطراف را ثابت نگه دارد. مدل جدید OpenAI در حوزه واقع‌گرایی و نمایش به سبک سینمایی و انیمیشنی عملکرد بسیار جالبی دارد.

به‌عنوان یک سیستم جامع برای تولید ویدیو و صدا، Sora 2 می‌تواند صداهای پس‌زمینه پیچیده، گفتار و جلوه‌های صوتی با درجه بالایی از واقع‌گرایی را تولید کند.

همچنین این امکان وجود دارد که اجزا از دنیای واقعی به‌طور مستقیم به Sora 2 وارد شوند. به‌عنوان نمونه، OpenAI بیان کرده است که این مدل پس از تماشای ویدیویی از یکی از اعضای تیم خود، توانسته است آن شخص را به هر محیطی که خلق می‌کند، اضافه کند و تصاویری با دقت بالا به همراه صدا از او ارائه دهد.

OpenAI به همراه Sora 2 یک اپلیکیشن جدید را عرضه کرده که Sora نام دارد و در آن می‌توانید ویدیو بسازید، ویدیوها را ترکیب کرده و به اشتراک بگذارید. همچنین امکان افزودن تصویر خود یا دوستانتان به ویدیوها وجود دارد و شما می‌توانید ویدیوهای دیگر کاربران را نیز مشاهده کنید.

اپلیکیشن Sora هم‌اکنون برای iOS قابل دانلود است، اما کاربران برای استفاده از آن می‌بایست در فهرست انتظار قرار گیرند. در حال حاضر این برنامه تنها برای کاربران ایالات متحده و کانادا در دسترس است. در آینده، مدل Sora 2 به صورت رایگان با برخی محدودیت‌ها برای همه افراد عرضه خواهد شد و کاربران ChatGPT Pro نیز به‌زودی می‌توانند به نسخه آزمایشی Sora 2 Pro با کیفیت بالاتر از طریق سایت Sora.com دسترسی پیدا کنند.

مقالات مرتبط

دکمه بازگشت به بالا