هوش مصنوعی

صدای هوش مصنوعی اکنون به قدری طبیعی است که هیچ تفاوتی با صدای انسان ندارد

تا به همین تازگی، تصور ما از صدای هوش مصنوعی به نوعی رباتیک و بی‌احساس بود، مشابه صداهایی که سیری یا الکسا تولید می‌کنند. اما یک پژوهش تازه نشان می‌دهد که این تصور به دوره‌ای گذشته تعلق دارد: اکنون فرد عادی نمی‌تواند میان صدای واقعی یک انسان و صدای تولید شده با تکنیک‌های هوش مصنوعی (دیپ‌فیک) تمایز قائل شود.

بر اساس گزارشی از لایوساینس، محققان دانشگاه کوئین مری لندن در این تحقیق از شرکت‌کنندگان خواستند تا به ۸۰ نمونه صوتی گوش دهند و مشخص کنند که کدام یک طبیعی و کدام یک ساخته هوش مصنوعی است. نتایج بسیار نگران‌کننده بود.

هنگامی که هوش مصنوعی صدایی را به‌طور کامل از ابتدا می‌ساخت، شرکت‌کنندگان در اکثریت موارد (حدود ۵۹ درصد) می‌توانستند آن را به درستی شناسایی کنند. اما در هنگامی که هوش مصنوعی صدای یک انسان واقعی را تقلید می‌کرد، نتایج به‌طور کامل مغایر بود. در این شرایط، شرکت‌کنندگان در حدود ۵۸ درصد موارد، صدای جعلی را به عنوان صدای واقعی انسان اشتباه تشخیص دادند. و وضعیت افرادی که موفق به شناسایی صدای مصنوعی می‌شدند، از نظر آماری به گونه‌ای نبود که نشان‌دهنده تشخیص دقیق آن‌ها باشد و بیشتر به قضاوت‌های تصادفی شباهت داشت.

عدم امکان تمییز صدای هوش مصنوعی از صدای انسان

توانایی هوش مصنوعی در تقلید صدای انسان، می‌تواند عواقب جدی‌ای برای امنیت، مسائل اخلاقی و حق کپی‌رایت به همراه داشته باشد. این تکنولوژی می‌تواند به ابزاری کارآمد در دستان کلاهبرداران تبدیل گردد. ما هم‌اکنون شاهد نمونه‌های عینی از این نوع سوءاستفاده‌ها هستیم.

جنایتکاران می‌توانند با تقلید صدای شما، سیستم‌های احراز هویت صوتی در بانک‌ها را دور بزنند یا با اعضای خانواده‌تان تماس گرفته و با ایجاد شرایط اضطراری از آن‌ها اخاذی کنند. (مانند موردی که در آن زنی به نام «شارون برایت‌ول» به دلیل شنیدن صدای گریه دخترش که به‌وسیله هوش مصنوعی تولید شده بود، ۱۵ هزار دلار از دست داد).

علاوه بر این، فناوری مذکور می‌تواند برای ایجاد مصاحبه‌ها یا بیانیه‌های جعلی از سیاستمداران و شخصیت‌های معروف به‌منظور تخریب اعتبار آن‌ها یا دامن زدن به ناآرامی‌های اجتماعی مورد استفاده قرار گیرد (مانند موردی که در آن، از کلون صوتی نخست‌وزیر کوئینزلند برای ترویج یک کلاهبرداری بیت‌کوین بهره‌برداری شد).

شاید نگران‌کننده‌ترین جنبه این مطالعه، سادگی و دسترسی آسان این فناوری باشد. پژوهشگران تأکید می‌کنند که کلون‌های صوتی به‌کار رفته در این تحقیق، به هیچ وجه پیچیدگی خاصی نداشتند. آن‌ها این صداها را با استفاده از نرم‌افزارهای تجاری که به سادگی در دسترس است، با کمترین تخصص فنی و صرفاً با استفاده از چند دقیقه فایل صوتی از صدای یک فرد و با تقریباً عدم هزینه‌ای ایجاد کرده بودند. این بدان معناست که این ابزار قدرتمند اکنون در دسترس همگان قرار گرفته است.

نتایج این تحقیق در نشریه PLoS One منتشر شده است.

مقالات مرتبط

دکمه بازگشت به بالا