OpenAI تکنولوژی نوینی برای اخذ اعترافات از هوش مصنوعی رونمایی کرد

آذر 13, 1404اخرین به روز رسانی: آذر 13, 1404

1 دقیقه مطالعه کنید

OpenAI سیستم جدیدی برای اعتراف‌گیری از هوش مصنوعی معرفی کرد

OpenAI در حال توسعه یک ساختار تازه به منظور آموزش مدل‌های هوش مصنوعی بوده که هدف آن، تشویق این مدل‌ها به اعتراف واقعی به رفتارهای ناخواسته خود است. این سیستم بر یکی از چالش‌های مهم مدل‌های زبانی که تمایل به ارائه پاسخ‌های بیش از حد مطلوب و گاهاً چاپلوسانه دارد، تمرکز کرده و سعی دارد مدل را وادار کند تا توضیحی دوم و مستقل درباره فرآیند رسیدن به پاسخ اصلی ارائه دهد.

چاپلوسی و ارائه پاسخی با اطمینان بیش از حد یکی از رفتارهای معمول در مدل‌های هوش مصنوعی معاصر به شمار می‌رود. علاوه بر این، برخی از این مدل‌ها ممکن است به حالت Hallucination دچار شده و پاسخ‌هایی نادرست ارایه دهند.

امروز OpenAI اعلام کرده است که چارچوب جدیدی که تحت عنوان سیستم اعتراف شناخته می‌شود، به‌صورت خاص بر صداقت تمرکز دارد و از معیارهای مختلف دیگری همچون کمک‌رسانی، دقت یا تبعیت از دستورات که معمولاً برای ارزیابی پاسخ‌ها به کار می‌روند پرهیز می‌کند.

به‌گفته محققان OpenAI، هدف اصلی این است که مدل قادر باشد بدون هرگونه ترس از تنبیه، درباره عملکرد خود به‌طور شفاف گزارش دهد؛ حتی اگر رفتار انجام‌شده به نوعی مشکل‌آفرین باشد. OpenAI در این رابطه اظهار داشته است:

«اگر مدل به‌راحتی اعتراف کند که مثلاً آزمونی را دور زده، از دستوری تخطی کرده یا به‌طور عمدی کیفیت عملکردش را کاهش داده، نه‌تنها تنبیه نخواهد شد، بلکه ممکن است پاداش بیشتری نیز دریافت کند.»

بر اساس توضیحات محققان این شرکت، چنین سیستمی قادر خواهد بود شفافیت مدل‌های زبانی را به‌طرز قابل توجهی ارتقا دهد و امکان نظارت بهتر بر رفتارهای مخفی مدل (اتفاقاتی که در پس‌زمینه یک پاسخ رخ می‌دهد) را به ارمغان آورد. OpenAI همچنین امیدوار است که «سیستم اعتراف» به ابزاری موثر در نسل‌های آینده مدل‌های زبانی تبدیل شود.

علاقه‌مندان می‌توانند گزارش فنی کامل این پروژه را دریافت کنند.

آذر 13, 1404اخرین به روز رسانی: آذر 13, 1404

1 دقیقه مطالعه کنید

OpenAI تکنولوژی نوینی برای اخذ اعترافات از هوش مصنوعی رونمایی کرد

شتاب‌دهنده پارالاکس در حال تدوین «گزارش چالش‌های صنعت بازی ایران» است

آموزش مدیریت موجودی Apple ID Balance؛ چطور دقیق بفهمیم چقدر اعتبار داریم؟

خرید یوسی پابجی موبایل با بهترین قیمت و تحویل فوری از واریا شاپ

بازی های 2026 PS5؛ منتظر چه عناوینی باشیم؟

خرید قسطی پلی‌استیشن ۵؛ راهی منطقی برای ورود به نسل نهم بازی‌ها بدون فشار مالی

مایکروسافت قابلیت «Copilot Mode» را به مرورگر Edge اضافه کرد

مدیر عامل ناشر GTA: هوش مصنوعی صرفاً یک «تردستی» محسوب می‌شود

احتمال انتشار بسته الحاقی مورد نظر برای بازی Silent Hill 2 Remake تقویت شد

این استاد ژاپنی از یک بازی ترسناک برای تدریس زبان در کنسول PS4 بهره می‌برد

پیشرفت محققان چینی؛ شبیه‌سازی شیمی کوانتومی به کمک ابرکامپیوتر کلاسیک

مادربرد Z890 AORUS Tachyon Ice از گیگابایت به رکورد جهانی DDR5-13010 دست یافت

بازگشت پورشه به استفاده از پیشرانه‌های بنزینی؛ کناره‌گیری از آرزوی خودروهای الکتریکی

یکی از مدیران ارشد طراحی اپل به متا پیوست

فروش کارت گرافیک RTX 5090 Matrix Edition به دلیل مشکلات کیفی متوقف شد

مقالات مرتبط

ساخت تراشه های هوش مصنوعی به تمرکز اصلی AMD تبدیل می شود

وردپرس با رونمایی از Telex؛ ابزاری هوش مصنوعی برای ساخت وب‌سایت

کنگره آمریکا استفاده از ChatGPT را محدود می کند

ابزارهای هوش مصنوعی مولد ادوبی فایرفلای در دسترس عموم قرار گرفت