۳۰ ریاضیدان معتبر از توانایی هوش مصنوعی در حل مسائل حیرتزده گشتند
در یک گردهمایی برگزار شده در ایالت کالیفرنیا، تعداد ۳۰ نفر از برجستهترین ریاضیدانان جهان به صورت مستقیم به ارزیابی قابلیتهای یک مدل پیشرفته هوش مصنوعی در حل مسائل دشوار پرداختند. این رویداد نتایج شگفتانگیز و تحسینآمیزی را به همراه داشت: مدل استدلالگر ChatGPT موفق به حل مسائل پیچیدهای که در سطح دکترا بودند، گردید.
بر اساس گزارشی از لایو ساینس، در میانه ماه مه سال جاری، یک رویداد علمی خاص و سری برگزار شد. ۳۰ تن از نوابغ ریاضی از نقاط مختلف جهان گرد هم آمدند تا در یک آزمون دو روزه تواناییهای مدل استدلالگر o4-mini متعلق به OpenAI را بسنجند. هدف آنها، طرح مسائلی بود که حتی برای ریاضیدانان حرفهای نیز چالشبرانگیز محسوب میشد.
مسائل ریاضی چالشبرانگیز برای ChatGPT
این رویارویی بخشی از پروژهای به نام FrontierMath بود که تحت نظارت سازمان غیرانتفاعی Epoch AI و به سفارش OpenAI اجرا میشد. هدف این تحقیق، سنجش واقعی توانایی هوش مصنوعی در استدلال و حل مشکلاتی بود که راهحلهای آن پیشتر در فضای اینترنت منتشر نشده و مدل نمیتوانست صرفاً با جستجو به پاسخ مورد نظر برسد. برای جلوگیری از هرگونه تقلب ناخواسته، تمامی ارتباطات میان ریاضیدانان شرکتکننده از طریق اپلیکیشن امن سیگنال انجام میشد و آنها به رعایت موارد محرمانه متعهد بودند.
در آغاز، ریاضیدانان با طرح مسائل پیچیده، موفق به به چالش کشیدن تواناییهای هوش مصنوعی شدند. برای هر مسئلهای که چتبات قادر به حل کردن آن نبود، طراح سؤال جایزهای به مبلغ ۷ هزار و ۵۰۰ دلار دریافت میکرد. اما این شرایط به زودی دگرگون شد.
«کن اونو» (Ken Ono)، ریاضیدان برجسته از دانشگاه ویرجینیا و یکی از داوران رویدادی که در حال حاضر توضیح داده میشود، بیان میکند که چگونه در ابتدا از عملکرد این چتبات ناامید شده بود. او سپس یک مسئله حلنشده از «نظریه اعداد» با سطح دکترا را به چتبات ارائه داد. اتفاقی که در ۱۰ دقیقه بعدی رخ داد، همه را شگفتزده کرد:
ربات در ابتدا دو دقیقه را صرف جستوجو و تسلط بر تمامی مقالات علمی مرتبط با آن زمینه کرد. سپس در صفحه خود نوشت که برای یادگیری بهتر، قصد دارد یکی از نسخههای سادهتر همان مسئله را حل نماید. چند دقیقه بعد اعلام کرد که اکنون برای حل مسئله اصلی و دشوارتر آماده است. پنج دقیقه پس از آن، o4-mini یک راهحل کاملاً صحیح و به عقیده پروفسور اونو، «گستاخانه» ارائه کرد. این هوش مصنوعی در پایان پاسخ خود بیان کرد: «نیازی به استناد به منابع نیست، زیرا این مسئله را خودم حل کردهام.»
پروفسور اونو ابراز میکند: «همکارانی دارم که به فعلیت ، واقعاً اذعان کردهاند که این مدلها به سطح نبوغ ریاضی نزدیک میشوند.»
مدل o4-mini، برخلاف مدلهای زبانی بزرگ مرسوم که صرفاً در تلاش برای پیشبینی کلمه بعدی هستند، یک مدل استدلالگر LLM به حساب میآید. این مدلها با استفاده از دادههای تخصصی و بازخورد انسانی قویتر تمرین میبینند. چنین روشی به آنها این امکان را میدهد که به جای تکرار اطلاعات، درک عمیقتری از مسائل پیچیده پیدا کرده و فرایند استدلال خود را بهصورت مرحلهای نمایش دهند.