هوش مصنوعی

مدال طلای المپیاد جهانی ریاضی با کمک مدل نوین OpenAI به دست آمد

مدل زبانی نوین OpenAI که برای استدلال و حل چالش‌های پیچیده طراحی شده است، موفق شده به عملکردی در سطح مدال طلای المپیاد جهانی ریاضی (IMO) سال 2025 دست یابد.

به گفته «الکساندر وی»، محقق OpenAI، این مدل تحت شرایطی مشابه انسان‌ها با دو جلسه 4.5 ساعته و بدون دسترسی به ابزار، اینترنت یا منابع خارجی آزمایش شده است. این مدل جدید OpenAI تنها با مطالعه توضیحات رسمی مسائل و ارائه اثبات‌هایی به زبان طبیعی به این موفقیت قابل توجه دست یافته است.

وی بیان می‌کند که این موفقیت از جنبه‌های متعددی اهمیت دارد. نخستین نکته این است که مسائل IMO نیازمند تفکر خلاق و استدلال مداوم در طول زمان است. وی اشاره می‌کند که مسیر پیشرفت مدل‌های زبانی در درک مفاهیم ریاضی از حل مسائل ساده‌ای مانند GSM8K که کمتر از یک دقیقه زمان می‌برد، آغاز شده و اکنون به مسائل IMO که زمان حل آن‌ها 100 دقیقه است، رسیده است.

علاوه بر این، توضیحات مربوط به IMO به صورت چندصفحه‌ای ارائه می‌شوند و ارزیابی آنها پیچیده‌تر است؛ از این‌رو، عبور از چارچوب‌های سنتی یادگیری تقویتی برای دستیابی به استدلال‌های دقیق انسانی، یک دستاورد چشمگیر محسوب می‌شود. نمونه‌ای از سؤالات این آزمون در تصویر زیر قابل مشاهده است.

عملکرد مدل OpenAI در المپیاد ریاضی

به نقل از پژوهشگر OpenAI، این مدل زبانی جدید موفق به حل 5 مسئله از 6 مسئله المپیاد 2025 شده و در مجموع امتیاز 35 از 42 امتیاز ممکن را کسب کرده است. او مدعی است که این امتیاز معادل مدال طلا است. همچنین هر یک از پاسخ‌های ارائه‌شده توسط مدل به‌طور مستقل توسط سه مدال‌آور سابق IMO بررسی شده و نمره نهایی با توافق کامل آن‌ها تعیین گردیده است.

مدل جدید OpenAI در حال حاضر تنها در مرحله آزمایشی است و نسخه‌ای با این سطح از قابلیت برای حل مسائل ریاضی در چند ماه آینده منتشر نخواهد شد. با این حال، وی تأکید می‌کند که این موفقیت نمایانگر سرعت پیشرفت چشمگیر هوش مصنوعی در سال‌های اخیر است.

هوش مصنوعی تاکنون در زمینه‌هایی همچون برنامه‌نویسی و ریاضیات پیشرفت‌های سریع و قابل توجهی را تجربه کرده است. به‌تازگی، یکی از مدل‌های OpenAI توانسته در رقابت برنامه‌نویسی AtCoder، مقام دوم را کسب کرده و در رتبه بالای همه انسان‌ها (به جز یک نفر) قرار بگیرد. همچنین در هفته‌های اخیر، مدل Grok-4 Heavy موفق به کسب نمره کامل 100 در آزمون ریاضی‌محور AIME 25 شده است. اکنون با موفقیت OpenAI در IMO، به نظر می‌رسد که زمان زیادی تا برتری کامل هوش مصنوعی بر انسان‌ها در زمینه‌هایی مانند ریاضیات و برنامه‌نویسی باقی نمانده است.

مقالات مرتبط

دکمه بازگشت به بالا