صدای هوش مصنوعی اکنون به قدری طبیعی است که هیچ تفاوتی با صدای انسان ندارد

اکتبر 6, 2025اخرین به روز رسانی: اکتبر 7, 2025

2 دقیقه خوانده شد

صدای هوش مصنوعی دیگر از صدای انسان قابل تشخیص نیست

تا به همین تازگی، تصور ما از صدای هوش مصنوعی به نوعی رباتیک و بی‌احساس بود، مشابه صداهایی که سیری یا الکسا تولید می‌کنند. اما یک پژوهش تازه نشان می‌دهد که این تصور به دوره‌ای گذشته تعلق دارد: اکنون فرد عادی نمی‌تواند میان صدای واقعی یک انسان و صدای تولید شده با تکنیک‌های هوش مصنوعی (دیپ‌فیک) تمایز قائل شود.

بر اساس گزارشی از لایوساینس، محققان دانشگاه کوئین مری لندن در این تحقیق از شرکت‌کنندگان خواستند تا به ۸۰ نمونه صوتی گوش دهند و مشخص کنند که کدام یک طبیعی و کدام یک ساخته هوش مصنوعی است. نتایج بسیار نگران‌کننده بود.

هنگامی که هوش مصنوعی صدایی را به‌طور کامل از ابتدا می‌ساخت، شرکت‌کنندگان در اکثریت موارد (حدود ۵۹ درصد) می‌توانستند آن را به درستی شناسایی کنند. اما در هنگامی که هوش مصنوعی صدای یک انسان واقعی را تقلید می‌کرد، نتایج به‌طور کامل مغایر بود. در این شرایط، شرکت‌کنندگان در حدود ۵۸ درصد موارد، صدای جعلی را به عنوان صدای واقعی انسان اشتباه تشخیص دادند. و وضعیت افرادی که موفق به شناسایی صدای مصنوعی می‌شدند، از نظر آماری به گونه‌ای نبود که نشان‌دهنده تشخیص دقیق آن‌ها باشد و بیشتر به قضاوت‌های تصادفی شباهت داشت.

عدم امکان تمییز صدای هوش مصنوعی از صدای انسان

توانایی هوش مصنوعی در تقلید صدای انسان، می‌تواند عواقب جدی‌ای برای امنیت، مسائل اخلاقی و حق کپی‌رایت به همراه داشته باشد. این تکنولوژی می‌تواند به ابزاری کارآمد در دستان کلاهبرداران تبدیل گردد. ما هم‌اکنون شاهد نمونه‌های عینی از این نوع سوءاستفاده‌ها هستیم.

جنایتکاران می‌توانند با تقلید صدای شما، سیستم‌های احراز هویت صوتی در بانک‌ها را دور بزنند یا با اعضای خانواده‌تان تماس گرفته و با ایجاد شرایط اضطراری از آن‌ها اخاذی کنند. (مانند موردی که در آن زنی به نام «شارون برایت‌ول» به دلیل شنیدن صدای گریه دخترش که به‌وسیله هوش مصنوعی تولید شده بود، ۱۵ هزار دلار از دست داد).

علاوه بر این، فناوری مذکور می‌تواند برای ایجاد مصاحبه‌ها یا بیانیه‌های جعلی از سیاستمداران و شخصیت‌های معروف به‌منظور تخریب اعتبار آن‌ها یا دامن زدن به ناآرامی‌های اجتماعی مورد استفاده قرار گیرد (مانند موردی که در آن، از کلون صوتی نخست‌وزیر کوئینزلند برای ترویج یک کلاهبرداری بیت‌کوین بهره‌برداری شد).

شاید نگران‌کننده‌ترین جنبه این مطالعه، سادگی و دسترسی آسان این فناوری باشد. پژوهشگران تأکید می‌کنند که کلون‌های صوتی به‌کار رفته در این تحقیق، به هیچ وجه پیچیدگی خاصی نداشتند. آن‌ها این صداها را با استفاده از نرم‌افزارهای تجاری که به سادگی در دسترس است، با کمترین تخصص فنی و صرفاً با استفاده از چند دقیقه فایل صوتی از صدای یک فرد و با تقریباً عدم هزینه‌ای ایجاد کرده بودند. این بدان معناست که این ابزار قدرتمند اکنون در دسترس همگان قرار گرفته است.

نتایج این تحقیق در نشریه PLoS One منتشر شده است.

اکتبر 6, 2025اخرین به روز رسانی: اکتبر 7, 2025

2 دقیقه خوانده شد

صدای هوش مصنوعی اکنون به قدری طبیعی است که هیچ تفاوتی با صدای انسان ندارد

عدم امکان تمییز صدای هوش مصنوعی از صدای انسان

پردازنده اینتل برای گیمینگ؛ کدام سری واقعاً بازی را عوض می‌کند؟

داستان موفقیت هلیکس گیم در صنعت گیم‌هاستینگ ایران

راز کارت های تاروت در Red Dead Redemption 2 که شما ندیدید!

چرا همه گیمرها یک شبه به سمت این لپ تاپ لنوو هجوم بردند

راز خرید یک لپ تاپ گیمینگ واقعی که کسی به شما نمی گوید

مایکروسافت قابلیت «Copilot Mode» را به مرورگر Edge اضافه کرد

مدیر عامل ناشر GTA: هوش مصنوعی صرفاً یک «تردستی» محسوب می‌شود

احتمال انتشار بسته الحاقی مورد نظر برای بازی Silent Hill 2 Remake تقویت شد

این استاد ژاپنی از یک بازی ترسناک برای تدریس زبان در کنسول PS4 بهره می‌برد

پیشرفت محققان چینی؛ شبیه‌سازی شیمی کوانتومی به کمک ابرکامپیوتر کلاسیک

مادربرد Z890 AORUS Tachyon Ice از گیگابایت به رکورد جهانی DDR5-13010 دست یافت

بازگشت پورشه به استفاده از پیشرانه‌های بنزینی؛ کناره‌گیری از آرزوی خودروهای الکتریکی

عدم امکان تمییز صدای هوش مصنوعی از صدای انسان

جزئیات ۱۲ مدل از پردازنده‌های اینتل پانتر لیک فاش شد

OpenAI به خالقان آثار هنری امکانات بیشتری در Sora می‌دهد

مقالات مرتبط

اینتل هوش مصنوعی مولد Aurora با 1 تریلیون پارامتر را معرفی کرد

دانشمندان اولین چت بات جهان با نام ELIZA را پس از ۶۰ سال احیا کردند

فایننشال تایمز: گوگل یک میلیارد دلار دیگر در آنتروپیک سرمایه گذاری می کند

OpenAI می خواهد قابلیت تولید ویدیو با مدل Sora را به ChatGPT بیاورد