شبیهسازی فوقالعادهای از کائنات + ویدیو

شرکت معتبر هوش مصنوعی Runway به تازگی نخستین «مدل جهانی» یا World Model خود را رونمایی کرده و بهطور همزمان، جدیدترین مدل ویدیویی خود را به قابلیتهای صوتی تازه مجهز کرده است. اصطلاح «مدل جهانی» به نوع خاصی از سیستمهای هوش مصنوعی اشاره دارد که قادرند با یادگیری یک شبیهسازی درونی از فرایندهای جهانی، به تواناییهایی چون استدلال و برنامهریزی دست یابند، بدون آنکه نیاز به آموزشهای جداگانهای داشته باشند.
با افزایش رقابت در عرصه مدلهای خصوصیمحور، اکنون Runway به جمع استارتاپها و غولهای فناوری پیوسته که در پی توسعه این نسل نوین از مدلها میباشند. مکانیزم مدل جدید این شرکت که GWM-1 نامیده میشود، بهصورت پیشبینی فریمبهفریم عمل کرده و بر اساس اظهارات Runway، قادر است شبیهسازیهایی با درک صحیح از قوانین فیزیکی و رفتار واقعگرایانه در طول زمان ایجاد نماید.
شرکت Runway که در همین ماه مدل ویدیویی Gen 4.5 خود را به بازار عرضه کرده بود، ادعا میکند که GWM-1 بهطور کلی از مدل Genie-3 گوگل و دیگر رقبا یک قدم جلوتر است. این شرکت مدل جدید خود را بهعنوان ابزاری برای توسعه شبیهسازیهای آموزشی در حوزههایی مانند رباتیک و علوم زیستی معرفی کرده است.
ایجاد شبیهسازیهای حیرتانگیز با هوش مصنوعی Runway
<pدر شبکه اجتماعی ایکس، حساب کاربری رسمی Runway با به اشتراکگذاری ویدیوی زیر بیان کرده است:
«شما یک صحنه ثابت به مدل میدهید و آن بهسرعت فضایی غوطهورکننده، نامحدود و کشفپذیر تولید میکند؛ فضایی که هنگام حرکت در آن، هندسه، نورپردازی و فیزیک بهصورت زنده و لحظهای شکل میگیرد. این امکان وجود دارد که به هر گوشهای سفر کنید. میتوانید هر شخصیتی را ایفا کنید: یک انسان درحال راه رفتن در شهر، یک پهپاد که در ارتفاعات کوههای برفی پرواز میکند، یا یک ربات که درون انبار مسیر را طی میکند.»
«آناستاسیس جرمَنیدیس»، مدیر ارشد فناوری موجود در Runway، در مورد این مدلها توضیحات زیر را ارائه میدهد:
«برای ایجاد یک مدل جهانی، در ابتدا میبایست یک مدل ویدیویی استثنائی تولید میکردیم. ما اعتقاد داریم که بهترین روش برای دستیابی به شبیهسازی همهمنظوره، آموزش مستقیم مدل برای پیشبینی پیکسلهاست. زمانی که مدل بهطور کافی و با دادههای صحیح آموزش ببیند، میتواند به درکی عمیق از چگونگی عملکرد جهان دست یابد.»
Runway انواع خاصی از مدل تازه خود را با عناوین GWM-Worlds ،GWM-Robotics و GWM-Avatars معرفی کرده است.
GWM-Worlds بهعنوان یک نرمافزار مبتنیبر مدل، امکان تولید پروژههای تعاملی را فراهم میآورد. با این ابزار، کاربران میتوانند با استفاده از یک پرامپت یا تصویر مرجع، صحنه مدنظر خود را خلق کرده و در آن به کاوش بپردازند. این شبیهسازی با نرخ 24 فریمبرثانیه و کیفیت 720p اجرا میشود. به ادعای Runway، این ویژگی میتواند نهتنها در توسعه بازیها مؤثر باشد، بلکه در آموزش رفتار و حرکت عوامل هوشمند در دنیای فیزیکی نیز کاربرد دارد.
نسخه GWM-Robotics بر تولید دادههای مصنوعی تمرکز دارد و در خصوص نسخه GWM-Avatars، این شرکت در حال کار بر روی آواتارهای بسیار واقعگرایانه برای شبیهسازی رفتار انسانی است. همچنین، نسخه GWM-Robotics از طریق یک SDK ارائه میشود و مذاکرات فعالی با چندین شرکت رباتیک و نهادهای تجاری برای بهکارگیری GWM-Robotics و GWM-Avatars در حال انجام است.
به گفته این شرکت، این سه نسخه در حال حاضر بهطور مستقل عمل میکنند، اما در نهایت هدف Runway ترکیب تمامی این قابلیتها در یک مدل واحد خواهد بود.
علاوه بر معرفی این مدل جهانی، Runway نسخه جدیدی از مدل پایه Gen 4.5 را نیز ارائه کرده است. این بهروزرسانی جدید شامل قابلیتهای صوتی بومی و تولید ویدیوهای بلندمدت چندشاته میباشد. به گفته این شرکت، کاربران با این آپدیت میتوانند ویدیوهای یکدقیقهای را با حفظ انسجام کاراکتر، دیالوگهای طبیعی، صدای پسزمینه و نماهای پیچیده از زوایای مختلف تولید نمایند. همچنین کاربر میتواند صوت موجود را ویرایش کرده، دیالوگ جدید اضافه کند و به تدوین ویدیوهای چندشاته با هر طول دلخواه بپردازد.



