ElevenLabs از هوش مصنوعی خیره کننده ای برای تولید صدا رونمایی کرد

خرداد 30, 1403اخرین به روز رسانی: اردیبهشت 19, 1404

0 1 دقیقه مطالعه کنید

ElevenLabs از هوش مصنوعی خیره‌کننده‌ای برای تولید صدا رونمایی کرد

استارتاپ هوش مصنوعی ElevenLabs چند هفته پس از راه اندازی مدل تبدیل متن به صدای Sound Effects، یک ابزار متن باز را نیز در اختیار کاربران قرار داده که پتانسیل های آن را نشان می دهند. این ابزار هوش مصنوعی تولید صدا به سازندگان اجازه می دهد تا برای ویدیوهای خود جلوه های صوتی ایجاد کنند.

هوش مصنوعی تولید صدا ElevenLabs

طبق گزارش های موجود، زمانی که ویدیو جدیدی را برای استفاده از این ابزار آپلود می کنید، چهار فریم در فواصل زمانی یک ثانیه ای ارائه می شود. سپس این فریم ها به همراه یک پرامپت به مدل GPT4o فرستاده می شوند تا پرامپت جدیدی گرفته شود. از این پرامپت از طریق API Sound Effects برای تولید افکت صوتی از متن استفاده می شود.

درنهایت صدای تولیدشده با ویدیوی کاربر ترکیب می شود تا فایل آن برای دانلود ارائه شود. همچنین باید به این موضوع اشاره کرد که درحال حاضر حداکثر یک ویدیو 22 ثانیه ای می توان از این ابزار دریافت کرد.

استفاده از این ابزار بسیار ساده است. فقط باید ویدیو بدون صدای خود را در آن آپلود کنید تا هوش مصنوعی ElevenLabs چهار گزینه با صدا به شما ارائه کند. احتمالاً می توان انتظار داشت که این هوش مصنوعی در آینده به سیستم های بزرگ تری اضافه شود تا تولیدکنندگان بتوانند از مزایای سیستم تولید صدای آن بهره ببرند.

«عمار ریشی»، مدیر بخش طراحی ElevenLabs می گوید:

«سازندگان ویدیوهای هوش مصنوعی اغلب به دنبال جلوه های صوتی عالی هستند و ما احساس می کنیم که با درک فریم ویدیوهای آن ها و سپس پیشنهاد بهترین خروجی، می توانیم به روند کار آن ها سرعت بخشیم.»

او همچنین ویدیویی را به اشتراک گذاشته که برای ساخت آن، از فناوری های ElevenLabs در کنار Luma AI و Hedra کمک گرفته شده است.

درحالی که توسعه دهندگان می توانند به کد این ابزار در GitHub دسترسی داشته باشند، ElevenLabs وب سایت جدیدی هم راه اندازی کرده تا Sound Effects API را امتحان کنید.

خرداد 30, 1403اخرین به روز رسانی: اردیبهشت 19, 1404

0 1 دقیقه مطالعه کنید

هوش مصنوعی تولید صدا ElevenLabs

ایلان ماسک می خواهد خدمات پرداخت ایکس تا پایان 2024 راه اندازی شود

آغاز تولید انبوه پردازنده Lunar Lake اینتل در TSMC با استفاده از گره 3 نانومتری!

مقالات مرتبط

یوتوب از ابزارهای هوش مصنوعی جدیدی برای سازندگان ویدیو رونمایی کرد

انقلاب ChatGPT تا 3 سال دیگر در حوزه رباتیک رقم می خورد

هوش مصنوعی اپل با قابلیت های جذاب امسال از راه می رسد

انویدیا با ایالت کالیفرنیا برای آموزش هوش مصنوعی به مردم همکاری می کند

دیدگاهتان را بنویسید لغو پاسخ