هوش مصنوعی جدید بایت دنس می تواند دیپ فیک های باورپذیری بسازد + ویدیو
محققان شرکت بایت دنس، مالک تیک تاک، سیستم هوش مصنوعی جدیدی به نام OmniHuman1 معرفی کرده اند که می تواند ویدیوهای دیپ فیک باورپذیری تولید کند.
براساس اعلام محققان بایت دنس، OmniHuman1 سیستم تولید ویدیوی چندوجهی محسوب می شود که روی ساخت ویدیو از انسان متمرکز است و می تواند حتی صدا نیز تولید کند. این سیستم از ورودی های تصویری نیز پشتیبانی می کند و محققان می گویند هیچ محدودیتی در اندازه تصویر وجود ندارد؛ برای مثال می توانید فقط عکس چهره کسی را به هوش مصنوعی بدهید تا از او ویدیو بسازد. همچنین این مدل به نمونه صدا برای قراردادن روی تصویر نیاز دارد.
تولید دیپ فیک با هوش مصنوعی OmniHuman1
دیپ فیک های هوش مصنوعی معمولاً نقص دارند و اگر با دقت به آنها نگاه کنید، متوجه می شوید ویدیو واقعی نیست اما به نظر می رسد OmniHuman1 می تواند دیپ فیک های باورپذیری تولید کند و شاید شناسایی واقعی یا جعلی بودن آن کمی دشوار باشد؛ برای مثال سخنرانی TED پایین کاملاً دیپ فیک است:
OmniHuman1 روی 19 هزار ساعت محتوای ویدیویی از منابع نامشخص آموزش دیده است و می تواند ویدیوهای موجود را نیز ویرایش کند؛ برای مثال می توانید با آن حرکات اعضای بدن را تغییر دهید و خروجی کار نیز قانع کننده باشد.
در ویدیوی پایین، می بینید چگونه عکس «آلبرت اینشتین»، فیزیک دان مشهور، به ویدیویی طبیعی تبدیل شده است:
البته OmniHuman1 بی نقص نیز نیست. محققان بایت دنس می گویند هوش مصنوعی آنها از تصاویر مرجع «با کیفیت پایین» نمی تواند ویدیوهای خوبی بسازد اما OmniHuman1 می تواند یکی از قوی ترین هوش مصنوعی ها برای ساخت دیپ فیک باشد. البته بایت دنس هنوز این هوش مصنوعی را منتشر نکرده است و مشخص نیست نسخه نهایی آن چگونه در دسترس قرار می گیرد یا چه بهبودهایی خواهد داشت.
درکل، تشخیص دیپ فیک سخت است. هرچند برخی شبکه های اجتماعی و موتورهای جستجو اقداماتی برای محدودکردن انتشار آنها انجام داده اند، حجم محتوای دیپ فیک آنلاین با سرعت نگران کننده ای رو به افزایش است. در نظرسنجی مه 2024 شرکت Jumio، حدود 60 درصد مردم گفتند سال گذشته میلادی با یک دیپ فیک مواجه شده اند. 72 درصد شرکت کنندگان نیز گفتند نگران اند با دیپ فیک فریب بخورند.