هوش مصنوعی

دو دانشجو هوش مصنوعی جدیدی برای رقابت با NotebookLM ساختند

دو دانشجوی کارشناسی که تخصصی زیادی نیز در زمینه هوش مصنوعی ندارند ادعا می کنند توانسته اند مدل هوش مصنوعی تازه ای بسازند که قادر است محتواهایی به سبک پادکست مشابه NotebookLM گوگل خلق کند.

به گزارش تک کرانچ، «توبی کیم»، یکی از بنیانگذاران Nari Labs که این مدل جدید گفتاری را منتشر کرده، گفت او و یکی دیگر از همکارانش حدوداً ۳ ماه پیش شروع به یادگیری درباره مدل های هوش مصنوعی گفتاری کردند. این تیم با الهام از NotebookLM گوگل می خواستند مدلی بسازند که کنترل بیشتری روی صداهای تولیدشده و آزادی در سناریو را به کاربران ارائه دهد.

تیم سازنده ادعا می کند این مدل توانایی رقابت با NotebookLM گوگل را دارد

به گفته توبی کیم، آنها از برنامه TPU Research Cloud گوگل برای ساخت این مدل استفاده کرده اند تا بتوانند مدل Nari با نام Dia را آموزش دهند. این برنامه امکان دسترسی رایگان به تراشه های هوش مصنوعی TPU گوگل را برای محققان فراهم می کند.

مدل Dia با استفاده از ۱.۶ میلیارد پارامتر می تواند دیالوگ ها را از روی یک اسکریپت تولید کند. همچنین این مدل به کاربران این امکان را می دهد تا لحن سخنران را سفارشی کرده و مواردی همچون ناهماهنگی ها، سرفه ها، خنده ها و سایر نشانه های غیرکلامی را اضافه کنند.

مدل Dia هم اکنون از طریق پلتفرم های Hugging Face و GitHub در دسترس علاقه مندان قرار دارد. این مدل می تواند روی اکثر رایانه های شخصی مدرن با حداقل ۱۰ گیگابایت VRAM اجرا شود. همچنین Dia قادر است تا در صورتی که دستورالعمل های خاصی دریافت نکند، به صورت رندوم اقدام به ساخت یک صدای تصادفی کند. علاوه براین، Dia توانایی تقلید صدای افراد را دارد.

بااین حال، مانند بسیاری از مدل های صوتی، Dia نیز حفاظت بسیار کمی در برابر سوءاستفاده های احتمالی دارد و سازندگان گفته اند که مسئولیتی را دراین باره قبول نمی کنند. همچنین Nari Labs فاش نکرده که از چه دیتاهایی برای آموزش این مدل استفاده کرده است. این احتمال وجود دارد که از دیتا های دارای حق کپی رایت برای آموزش Dia استفاده شده باشد.

مقالات مرتبط

دکمه بازگشت به بالا