هوش مصنوعی

بایت‌دنس از نسخه 1.0 هوش مصنوعی Seed3D رونمایی کرد؛ تبدیل تصاویر به مدل‌های سه‌بعدی

کمپانی بایت‌دنس، که به عنوان شرکت مادر تیک‌تاک شناخته می‌شود، به تازگی از یک ابزار هوش مصنوعی پیشرفته به نام Seed3D 1.0 رونمایی کرده است. این ابزار فراتر از یک مولد مدل سه‌بعدی معمولی عمل می‌کند و قادر است یک تصویر دوبعدی ساده را به یک مدل سه‌بعدی کامل و آماده برای شبیه‌سازی تبدیل کند.

ابزارهایی نظیر Gaussian Splatting و پروژه‌های متن‌بازی مانند Hunyuan3D در عرصه تولید محتوای سه‌بعدی عملکرد برجسته‌ای را از خود نشان می‌دهند، اما بایت‌دنس ادعا می‌کند که Seed3D 1.0 در زمینه کیفیت بافت و هندسه، رقبای متن‌باز و بسته را به چالش می‌کشد. جالب توجه است که این ابزار با سیستم ۱.۵ میلیارد پارامتری خود، به چنین کیفیتی دست یافته و حتی مدل‌های بزرگ‌تری مانند Hunyuan3D 2.1 (که دارای ۳ میلیارد پارامتر است) را نیز پشت سر گذاشته است.

نوآوری اصلی ابزار Seed3D 1.0 در استراتژی تولید مرحله به مرحله آن نهفته است: ۱. در گام اول، تصویر ورودی با استفاده از یک مدل زبان-بینایی (VLM) تحلیل شده و اشیاء و ویژگی‌های فضایی آنها استخراج می‌شود. ۲. سپس برای هر شیء شناسایی شده، یک مدل سه‌بعدی مجزا ایجاد می‌گردد. ۳. در نهایت، تمامی مدل‌های سه‌بعدی تولید شده با توجه به چیدمان فضایی پیش‌بینی شده توسط VLM، در یک صحنه کامل ادغام می‌شوند.

مدل Seed3D 1.0 بایت‌دنس

در مقایسه با بسیاری از مدل‌های مشابه، خروجی‌های Seed3D 1.0 تنها به اهداف تحقیقاتی یا رندرهای ساده محدود نمی‌شوند؛ این مدل‌ها به‌طور خاص «آماده شبیه‌سازی» به حساب می‌آیند. به عنوان مثال، می‌توان این مدل‌ها را به‌صورت مستقیم در پلتفرم‌های شبیه‌سازی مانند Isaac Sim (وابسته به انویدیا) برای آموزش ربات‌ها به کار گرفت.

زمانی که یک مدل سه‌بعدی به شبیه‌ساز بارگذاری می‌شود، VLM به ارزیابی اندازه واقعی شیء پرداخته و سپس Isaac Sim به صورت خودکار مش‌های برخورد (Collision Mesh) مورد نیاز را برای آن تولید می‌کند. این قابلیت باعث می‌شود که شبیه‌سازی‌هایی مانند برداشتن اشیا به وسیله یک بازوی رباتیک، به سرعت و بدون نیاز به تنظیمات دستی پیچیده آغاز گردد.

علاوه بر این، Seed3D 1.0 توانایی ایجاد صحنه‌های کامل را نیز دارد؛ این ابزار می‌تواند یک شیء واحد (مانند یک صندلی) یا یک فضای داخلی کاملاً جزئی (مانند یک دفتر کار) و حتی یک منظر شهری وسیع را تولید کند. براساس ارزیابی‌های انسان‌محور، Seed3D 1.0 در شش بُعد کلیدی؛ از جمله جزئیات دقیق و بازسازی ویژگی‌های پیچیده، عملکردی قوی و رقابتی را از خود به نمایش گذاشته و در بنچمارک‌های هندسی (مانند ULIP-I و Uni3D-I) نیز موفق به پیشی گرفتن از رقبای خود شده است.

مقالات مرتبط

دکمه بازگشت به بالا