هوش مصنوعی

شبیه‌سازی فوق‌العاده‌ای از کائنات + ویدیو

شرکت معتبر هوش مصنوعی Runway به تازگی نخستین «مدل جهانی» یا World Model خود را رونمایی کرده و به‌طور هم‌زمان، جدیدترین مدل ویدیویی خود را به قابلیت‌های صوتی تازه مجهز کرده است. اصطلاح «مدل جهانی» به نوع خاصی از سیستم‌های هوش مصنوعی اشاره دارد که قادرند با یادگیری یک شبیه‌سازی درونی از فرایندهای جهانی، به توانایی‌هایی چون استدلال و برنامه‌ریزی دست یابند، بدون آنکه نیاز به آموزش‌های جداگانه‌ای داشته باشند.

با افزایش رقابت در عرصه مدل‌های خصوصی‌محور، اکنون Runway به جمع استارتاپ‌ها و غول‌های فناوری پیوسته که در پی توسعه این نسل نوین از مدل‌ها می‌باشند. مکانیزم مدل جدید این شرکت که GWM-1 نامیده می‌شود، به‌صورت پیش‌بینی فریم‌به‌فریم عمل کرده و بر اساس اظهارات Runway، قادر است شبیه‌سازی‌هایی با درک صحیح از قوانین فیزیکی و رفتار واقع‌گرایانه در طول زمان ایجاد نماید.

شرکت Runway که در همین ماه مدل ویدیویی Gen 4.5 خود را به بازار عرضه کرده بود، ادعا می‌کند که GWM-1 به‌طور کلی از مدل Genie-3 گوگل و دیگر رقبا یک قدم جلوتر است. این شرکت مدل جدید خود را به‌عنوان ابزاری برای توسعه شبیه‌سازی‌های آموزشی در حوزه‌هایی مانند رباتیک و علوم زیستی معرفی کرده است.

ایجاد شبیه‌سازی‌های حیرت‌انگیز با هوش مصنوعی Runway

<pدر شبکه اجتماعی ایکس، حساب کاربری رسمی Runway با به اشتراک‌گذاری ویدیوی زیر بیان کرده است:

«شما یک صحنه ثابت به مدل می‌دهید و آن به‌سرعت فضایی غوطه‌ورکننده، نامحدود و کشف‌پذیر تولید می‌کند؛ فضایی که هنگام حرکت در آن، هندسه، نورپردازی و فیزیک به‌صورت زنده و لحظه‌ای شکل می‌گیرد. این امکان وجود دارد که به هر گوشه‌ای سفر کنید. می‌توانید هر شخصیتی را ایفا کنید: یک انسان درحال راه رفتن در شهر، یک پهپاد که در ارتفاعات کوه‌های برفی پرواز می‌کند، یا یک ربات که درون انبار مسیر را طی می‌کند.»

«آناستاسیس جرمَنیدیس»، مدیر ارشد فناوری موجود در Runway، در مورد این مدل‌ها توضیحات زیر را ارائه می‌دهد:

«برای ایجاد یک مدل جهانی، در ابتدا می‌بایست یک مدل ویدیویی استثنائی تولید می‌کردیم. ما اعتقاد داریم که بهترین روش برای دستیابی به شبیه‌سازی همه‌منظوره، آموزش مستقیم مدل برای پیش‌بینی پیکسل‌هاست. زمانی که مدل به‌طور کافی و با داده‌های صحیح آموزش ببیند، می‌تواند به درکی عمیق از چگونگی عملکرد جهان دست یابد.»

Runway انواع خاصی از مدل تازه خود را با عناوین GWM-Worlds ،GWM-Robotics و GWM-Avatars معرفی کرده است.

GWM-Worlds به‌عنوان یک نرم‌افزار مبتنی‌بر مدل، امکان تولید پروژه‌های تعاملی را فراهم می‌آورد. با این ابزار، کاربران می‌توانند با استفاده از یک پرامپت یا تصویر مرجع، صحنه مدنظر خود را خلق کرده و در آن به کاوش بپردازند. این شبیه‌سازی با نرخ 24 فریم‌برثانیه و کیفیت 720p اجرا می‌شود. به ادعای Runway، این ویژگی می‌تواند نه‌تنها در توسعه بازی‌ها مؤثر باشد، بلکه در آموزش رفتار و حرکت عوامل هوشمند در دنیای فیزیکی نیز کاربرد دارد.

نسخه GWM-Robotics بر تولید داده‌های مصنوعی تمرکز دارد و در خصوص نسخه GWM-Avatars، این شرکت در حال کار بر روی آواتارهای بسیار واقع‌گرایانه برای شبیه‌سازی رفتار انسانی است. همچنین، نسخه GWM-Robotics از طریق یک SDK ارائه می‌شود و مذاکرات فعالی با چندین شرکت رباتیک و نهادهای تجاری برای به‌کارگیری GWM-Robotics و GWM-Avatars در حال انجام است.

به گفته این شرکت، این سه نسخه در حال حاضر به‌طور مستقل عمل می‌کنند، اما در نهایت هدف Runway ترکیب تمامی این قابلیت‌ها در یک مدل واحد خواهد بود.

علاوه بر معرفی این مدل جهانی، Runway نسخه جدیدی از مدل پایه Gen 4.5 را نیز ارائه کرده است. این به‌روزرسانی جدید شامل قابلیت‌های صوتی بومی و تولید ویدیوهای بلندمدت چندشاته می‌باشد. به گفته این شرکت، کاربران با این آپدیت می‌توانند ویدیوهای یک‌دقیقه‌ای را با حفظ انسجام کاراکتر، دیالوگ‌های طبیعی، صدای پس‌زمینه و نماهای پیچیده از زوایای مختلف تولید نمایند. همچنین کاربر می‌تواند صوت موجود را ویرایش کرده، دیالوگ جدید اضافه کند و به تدوین ویدیوهای چندشاته با هر طول دلخواه بپردازد.

مقالات مرتبط

دکمه بازگشت به بالا