از محتوای وب میتوان برای آموزش هوش مصنوعی بهره برد
یکی از بزرگترین بحثها در دنیای هوش مصنوعی مولد این است که شرکتهایی که این مدلها را آموزش میدهند ممکن است از دادههای تحت کپیرایت در وب استفاده کنند. تاکنون نیز این امر منجر به شکایتهای متعددی علیه شرکتهای هوش مصنوعی مولد، ازجمله مایکروسافت و OpenAI شده است. اکنون «مصطفی سلیمان»، مدیر ارشد هوش مصنوعی مایکروسافت آشکارا میگوید هر کسی میتواند از این دادهها بهره ببرد.
مصطفی سلیمان بهتازگی با «اندرو راس سورکین» از CNBC مصاحبه کرده و در آن به یکی از پرحاشیهترین بحثهای آموزش هوش مصنوعی مولد پرداخته است. در قسمتی از این مصاحبه مصطفی سلیمان درباره استفاده آزادانه از دادههای موجود در وب میگوید:
«قرارداد اجتماعی محتواها از دهه 90 این بوده است که میتوان از محتوایی که در وب باز وجود دارد، استفاده منصفانه کرد. هر کسی میتواند آن را کپی، بازسازی یا بازتولید کند. این [محتوا] رایگانافزار (Freeware) بوده است.»
نظرات مصطفی سلیمان درباره آموزش هوش مصنوعی
مصطفی سلیمان همچنین درباره محتواهایی که ناشر اجازه استفاده از آنها را نداده، صحبت کرد. او میگوید که علاوهبر محتواهای باز موجود در وب، یک دستهبندی جداگانه نیز وجود دارد که در آن یک وبسایت، ناشر یا سازمان خبری به صراحت گفته است که به هر دلیلی از ایندکسکردن و استخراج مطالب خودداری شود. بهزعم مصطفی سلیمان این دستهبندی خاکستری است و احتمالاً استفاده از آن میتواند به دادگاه منتهی شود.
به نظر میرسد پاسخ سلیمان نشان میدهد که مایکروسافت و شاید دیگر شرکتهای مولد هوش مصنوعی، معتقدند تقریباً از همه چیز در اینترنت میتوان برای آموزش مدلهای آنها استفاده کرد و آن شرکتها مجبور نیستند به سازندگان آن محتوا پولی بدهند. این مشاجره احتمالاً باعث میشود که در ماهها و سالهای آینده مسائل حقوقی بیشتری مطرح شود.
طبق گزارش هفته گذشته، استارتاپ TollBit میگوید که چند شرکت هوش مصنوعی ظاهراً پروتکل امنیتی سایتها را که برای جلوگیری از استخراج مطالب آنها استفاده میشود، نادیده میگیرند. به نظر میرسد دو شرکت بزرگ OpenAI و Anthropic نیز این پروتکلها را دور میزنند.