هوش مصنوعی

۳۰ ریاضی‌دان معتبر از توانایی هوش مصنوعی در حل مسائل حیرت‌زده گشتند

در یک گردهمایی برگزار شده در ایالت کالیفرنیا، تعداد ۳۰ نفر از برجسته‌ترین ریاضیدانان جهان به صورت مستقیم به ارزیابی قابلیت‌های یک مدل پیشرفته هوش مصنوعی در حل مسائل دشوار پرداختند. این رویداد نتایج شگفت‌انگیز و تحسین‌آمیزی را به همراه داشت: مدل استدلال‌گر ChatGPT موفق به حل مسائل پیچیده‌ای که در سطح دکترا بودند، گردید.

بر اساس گزارشی از لایو ساینس، در میانه ماه مه سال جاری، یک رویداد علمی خاص و سری برگزار شد. ۳۰ تن از نوابغ ریاضی از نقاط مختلف جهان گرد هم آمدند تا در یک آزمون دو روزه توانایی‌های مدل استدلال‌گر o4-mini متعلق به OpenAI را بسنجند. هدف آن‌ها، طرح مسائلی بود که حتی برای ریاضیدانان حرفه‌ای نیز چالش‌برانگیز محسوب می‌شد.

مسائل ریاضی چالش‌برانگیز برای ChatGPT

این رویارویی بخشی از پروژه‌ای به نام FrontierMath بود که تحت نظارت سازمان غیرانتفاعی Epoch AI و به سفارش OpenAI اجرا می‌شد. هدف این تحقیق، سنجش واقعی توانایی هوش مصنوعی در استدلال و حل مشکلاتی بود که راه‌حل‌های آن پیش‌تر در فضای اینترنت منتشر نشده و مدل نمی‌توانست صرفاً با جستجو به پاسخ مورد نظر برسد. برای جلوگیری از هرگونه تقلب ناخواسته، تمامی ارتباطات میان ریاضیدانان شرکت‌کننده از طریق اپلیکیشن امن سیگنال انجام می‌شد و آن‌ها به رعایت موارد محرمانه متعهد بودند.

در آغاز، ریاضیدانان با طرح مسائل پیچیده، موفق به به چالش کشیدن توانایی‌های هوش مصنوعی شدند. برای هر مسئله‌ای که چت‌بات قادر به حل کردن آن نبود، طراح سؤال جایزه‌ای به مبلغ ۷ هزار و ۵۰۰ دلار دریافت می‌کرد. اما این شرایط به زودی دگرگون شد.

«کن اونو» (Ken Ono)، ریاضیدان برجسته از دانشگاه ویرجینیا و یکی از داوران رویدادی که در حال حاضر توضیح داده می‌شود، بیان می‌کند که چگونه در ابتدا از عملکرد این چت‌بات ناامید شده بود. او سپس یک مسئله حل‌نشده از «نظریه اعداد» با سطح دکترا را به چت‌بات ارائه داد. اتفاقی که در ۱۰ دقیقه بعدی رخ داد، همه را شگفت‌زده کرد:

ربات در ابتدا دو دقیقه را صرف جست‌وجو و تسلط بر تمامی مقالات علمی مرتبط با آن زمینه کرد. سپس در صفحه خود نوشت که برای یادگیری بهتر، قصد دارد یکی از نسخه‌های ساده‌تر همان مسئله را حل نماید. چند دقیقه بعد اعلام کرد که اکنون برای حل مسئله اصلی و دشوارتر آماده است. پنج دقیقه پس از آن، o4-mini یک راه‌حل کاملاً صحیح و به عقیده پروفسور اونو، «گستاخانه» ارائه کرد. این هوش مصنوعی در پایان پاسخ خود بیان کرد: «نیازی به استناد به منابع نیست، زیرا این مسئله را خودم حل کرده‌ام.»

پروفسور اونو ابراز می‌کند: «همکارانی دارم که به فعلیت ، واقعاً اذعان کرده‌اند که این مدل‌ها به سطح نبوغ ریاضی نزدیک می‌شوند.»

مدل o4-mini، برخلاف مدل‌های زبانی بزرگ مرسوم که صرفاً در تلاش برای پیش‌بینی کلمه بعدی هستند، یک مدل استدلال‌گر LLM به حساب می‌آید. این مدل‌ها با استفاده از داده‌های تخصصی و بازخورد انسانی قوی‌تر تمرین می‌بینند. چنین روشی به آن‌ها این امکان را می‌دهد که به جای تکرار اطلاعات، درک عمیق‌تری از مسائل پیچیده پیدا کرده و فرایند استدلال خود را به‌صورت مرحله‌ای نمایش دهند.

مقالات مرتبط

دکمه بازگشت به بالا