صدای هوش مصنوعی اکنون به قدری طبیعی است که هیچ تفاوتی با صدای انسان ندارد

تا به همین تازگی، تصور ما از صدای هوش مصنوعی به نوعی رباتیک و بیاحساس بود، مشابه صداهایی که سیری یا الکسا تولید میکنند. اما یک پژوهش تازه نشان میدهد که این تصور به دورهای گذشته تعلق دارد: اکنون فرد عادی نمیتواند میان صدای واقعی یک انسان و صدای تولید شده با تکنیکهای هوش مصنوعی (دیپفیک) تمایز قائل شود.
بر اساس گزارشی از لایوساینس، محققان دانشگاه کوئین مری لندن در این تحقیق از شرکتکنندگان خواستند تا به ۸۰ نمونه صوتی گوش دهند و مشخص کنند که کدام یک طبیعی و کدام یک ساخته هوش مصنوعی است. نتایج بسیار نگرانکننده بود.
هنگامی که هوش مصنوعی صدایی را بهطور کامل از ابتدا میساخت، شرکتکنندگان در اکثریت موارد (حدود ۵۹ درصد) میتوانستند آن را به درستی شناسایی کنند. اما در هنگامی که هوش مصنوعی صدای یک انسان واقعی را تقلید میکرد، نتایج بهطور کامل مغایر بود. در این شرایط، شرکتکنندگان در حدود ۵۸ درصد موارد، صدای جعلی را به عنوان صدای واقعی انسان اشتباه تشخیص دادند. و وضعیت افرادی که موفق به شناسایی صدای مصنوعی میشدند، از نظر آماری به گونهای نبود که نشاندهنده تشخیص دقیق آنها باشد و بیشتر به قضاوتهای تصادفی شباهت داشت.
عدم امکان تمییز صدای هوش مصنوعی از صدای انسان
توانایی هوش مصنوعی در تقلید صدای انسان، میتواند عواقب جدیای برای امنیت، مسائل اخلاقی و حق کپیرایت به همراه داشته باشد. این تکنولوژی میتواند به ابزاری کارآمد در دستان کلاهبرداران تبدیل گردد. ما هماکنون شاهد نمونههای عینی از این نوع سوءاستفادهها هستیم.
جنایتکاران میتوانند با تقلید صدای شما، سیستمهای احراز هویت صوتی در بانکها را دور بزنند یا با اعضای خانوادهتان تماس گرفته و با ایجاد شرایط اضطراری از آنها اخاذی کنند. (مانند موردی که در آن زنی به نام «شارون برایتول» به دلیل شنیدن صدای گریه دخترش که بهوسیله هوش مصنوعی تولید شده بود، ۱۵ هزار دلار از دست داد).
علاوه بر این، فناوری مذکور میتواند برای ایجاد مصاحبهها یا بیانیههای جعلی از سیاستمداران و شخصیتهای معروف بهمنظور تخریب اعتبار آنها یا دامن زدن به ناآرامیهای اجتماعی مورد استفاده قرار گیرد (مانند موردی که در آن، از کلون صوتی نخستوزیر کوئینزلند برای ترویج یک کلاهبرداری بیتکوین بهرهبرداری شد).
شاید نگرانکنندهترین جنبه این مطالعه، سادگی و دسترسی آسان این فناوری باشد. پژوهشگران تأکید میکنند که کلونهای صوتی بهکار رفته در این تحقیق، به هیچ وجه پیچیدگی خاصی نداشتند. آنها این صداها را با استفاده از نرمافزارهای تجاری که به سادگی در دسترس است، با کمترین تخصص فنی و صرفاً با استفاده از چند دقیقه فایل صوتی از صدای یک فرد و با تقریباً عدم هزینهای ایجاد کرده بودند. این بدان معناست که این ابزار قدرتمند اکنون در دسترس همگان قرار گرفته است.
نتایج این تحقیق در نشریه PLoS One منتشر شده است.




