مطالعه محقق ایرانی موفق به کشف روش سیستماتیک جیلبریک ChatGPT شد

دسامبر 6, 2023اخرین به روز رسانی: می 9, 2025

2 دقیقه خوانده شد

مطالعه محقق ایرانی موفق به کشف روش سیستماتیک جیلبریک ChatGPT شد

استارتاپ Robust Intelligence با همراهی محققان دانشگاه ییل، از جمله دکتر «امین کرباسی»، دانشیار ایرانی این دانشگاه، از روشی سیستماتیک برای جیلبریک مدل های زبانی بزرگ (LLM) مانند مدل GPT4 پرده برداشت. در این روش از مدل های هوش مصنوعی برای کشف جیلبریک ها استفاده می شود. این استارتاپ می گوید که برخی از خطرات موجود در مدل های زبانی بزرگ، نیاز به توجه جدی تری دارند.

براساس گزارش وایرد، استارتاپ Robust Intelligence که در سال 2020 برای توسعه راه هایی برای محافظت از سیستم های هوش مصنوعی تأسیس شد، می گوید برخی از خطرات موجود در این مدل ها نیاز به توجه بیشتری دارند. «یارون سینگر»، مدیرعامل شرکت Robust Intelligence و استاد علوم کامپیوتر در دانشگاه هاروارد، می گوید:

«یک مشکل ایمنی سیستماتیک [در مدل های هوش مصنوعی] وجود دارد، که به آن توجه و رسیدگی نمی شود. آنچه ما در اینجا کشف کرده ایم یک رویکرد سیستماتیک برای حمله به هر مدل زبانی بزرگ است.»

کشف جیلبریک در مدل های هوش مصنوعی

استارتاپ Robust Intelligence با یک ترفند جدید و با یک سری حملات برنامه ریزی شده، ضعف های اساسی در مدل های زبان بزرگ را مشخص کرد و نشان داد که روش های موجود برای محافظت از آن ها به خوبی عمل نمی کند. این جیلبریک جدید از سیستم های هوش مصنوعی برای تولید و ارزیابی پرامپت هایی استفاده می کند که سعی دارند با ارسال درخواست ها به یک API (واسط برنامه نویسی کاربردی) سازوکارهای امنیتی چت بات های هوش مصنوعی را دور بزنند.

جیلبریک کردن در این جا به معنای ایجاد پرامپت برای نقض دستورالعمل های محتوایی مدل هوش مصنوعی و سوء استفاده از آن است.

یکی از محققان این حوزه می گوید که برخی از مدل های هوش مصنوعی، تدابیر ایمنی خاصی دارند که می توانند حملات را مسدود کنند، اما او اضافه می کند که درواقع به خاطر نحوه کار این مدل ها، آسیب پذیری هایی ذاتی در این سیستم ها وجود دارد و بنابراین دفاع از آن ها سخت می شود.

محققان مقاله خود را در arXiv منتشر کرده و به OpenAI در مورد آسیب پذیری مدل های زبانی بزرگ هشدار داده اند؛ اما هنوز پاسخی از این شرکت دریافت نکرده اند. مدل های زبانی بزرگ اخیراً به عنوان نوع جدیدی از فناوری های قدرتمند و دگرگون کننده ظهور کرده اند. پتانسیل آن ها به خصوص از زمان معرفی ChatGPT بسیاری از مردم را مبهوت این فناوری کرده است.

دسامبر 6, 2023اخرین به روز رسانی: می 9, 2025

2 دقیقه خوانده شد

مطالعه محقق ایرانی موفق به کشف روش سیستماتیک جیلبریک ChatGPT شد

کشف جیلبریک در مدل های هوش مصنوعی

پردازنده اینتل برای گیمینگ؛ کدام سری واقعاً بازی را عوض می‌کند؟

داستان موفقیت هلیکس گیم در صنعت گیم‌هاستینگ ایران

راز کارت های تاروت در Red Dead Redemption 2 که شما ندیدید!

چرا همه گیمرها یک شبه به سمت این لپ تاپ لنوو هجوم بردند

راز خرید یک لپ تاپ گیمینگ واقعی که کسی به شما نمی گوید

مایکروسافت قابلیت «Copilot Mode» را به مرورگر Edge اضافه کرد

مدیر عامل ناشر GTA: هوش مصنوعی صرفاً یک «تردستی» محسوب می‌شود

احتمال انتشار بسته الحاقی مورد نظر برای بازی Silent Hill 2 Remake تقویت شد

این استاد ژاپنی از یک بازی ترسناک برای تدریس زبان در کنسول PS4 بهره می‌برد

پیشرفت محققان چینی؛ شبیه‌سازی شیمی کوانتومی به کمک ابرکامپیوتر کلاسیک

مادربرد Z890 AORUS Tachyon Ice از گیگابایت به رکورد جهانی DDR5-13010 دست یافت

بازگشت پورشه به استفاده از پیشرانه‌های بنزینی؛ کناره‌گیری از آرزوی خودروهای الکتریکی

کشف جیلبریک در مدل های هوش مصنوعی

نسخه جدید دیسکورد موبایل با بهبود قابلیت های پیام رسانی منتشر شد

اپلیکیشن Beeper Mini معرفی شد؛ iMessage برای گوشی های اندرویدی

مقالات مرتبط

همکاری پاناسونیک و آنتروپیک؛ دستیار هوش مصنوعی Umi معرفی شد

مدیرعامل OpenAI می‌گوید همه تعدیل نیروها تقصیر هوش مصنوعی نیست

هوش مصنوعی GPT-5 در دنیای کلاسیک پوکمون به رکوردشکنی پرداخت

پلیس آمریکا حالا از هوش مصنوعی برای نوشتن گزارش ها استفاده می کند