مدال طلای المپیاد جهانی ریاضی با کمک مدل نوین OpenAI به دست آمد
مدل زبانی نوین OpenAI که برای استدلال و حل چالشهای پیچیده طراحی شده است، موفق شده به عملکردی در سطح مدال طلای المپیاد جهانی ریاضی (IMO) سال 2025 دست یابد.
به گفته «الکساندر وی»، محقق OpenAI، این مدل تحت شرایطی مشابه انسانها با دو جلسه 4.5 ساعته و بدون دسترسی به ابزار، اینترنت یا منابع خارجی آزمایش شده است. این مدل جدید OpenAI تنها با مطالعه توضیحات رسمی مسائل و ارائه اثباتهایی به زبان طبیعی به این موفقیت قابل توجه دست یافته است.
وی بیان میکند که این موفقیت از جنبههای متعددی اهمیت دارد. نخستین نکته این است که مسائل IMO نیازمند تفکر خلاق و استدلال مداوم در طول زمان است. وی اشاره میکند که مسیر پیشرفت مدلهای زبانی در درک مفاهیم ریاضی از حل مسائل سادهای مانند GSM8K که کمتر از یک دقیقه زمان میبرد، آغاز شده و اکنون به مسائل IMO که زمان حل آنها 100 دقیقه است، رسیده است.
علاوه بر این، توضیحات مربوط به IMO به صورت چندصفحهای ارائه میشوند و ارزیابی آنها پیچیدهتر است؛ از اینرو، عبور از چارچوبهای سنتی یادگیری تقویتی برای دستیابی به استدلالهای دقیق انسانی، یک دستاورد چشمگیر محسوب میشود. نمونهای از سؤالات این آزمون در تصویر زیر قابل مشاهده است.
عملکرد مدل OpenAI در المپیاد ریاضی
به نقل از پژوهشگر OpenAI، این مدل زبانی جدید موفق به حل 5 مسئله از 6 مسئله المپیاد 2025 شده و در مجموع امتیاز 35 از 42 امتیاز ممکن را کسب کرده است. او مدعی است که این امتیاز معادل مدال طلا است. همچنین هر یک از پاسخهای ارائهشده توسط مدل بهطور مستقل توسط سه مدالآور سابق IMO بررسی شده و نمره نهایی با توافق کامل آنها تعیین گردیده است.
مدل جدید OpenAI در حال حاضر تنها در مرحله آزمایشی است و نسخهای با این سطح از قابلیت برای حل مسائل ریاضی در چند ماه آینده منتشر نخواهد شد. با این حال، وی تأکید میکند که این موفقیت نمایانگر سرعت پیشرفت چشمگیر هوش مصنوعی در سالهای اخیر است.
هوش مصنوعی تاکنون در زمینههایی همچون برنامهنویسی و ریاضیات پیشرفتهای سریع و قابل توجهی را تجربه کرده است. بهتازگی، یکی از مدلهای OpenAI توانسته در رقابت برنامهنویسی AtCoder، مقام دوم را کسب کرده و در رتبه بالای همه انسانها (به جز یک نفر) قرار بگیرد. همچنین در هفتههای اخیر، مدل Grok-4 Heavy موفق به کسب نمره کامل 100 در آزمون ریاضیمحور AIME 25 شده است. اکنون با موفقیت OpenAI در IMO، به نظر میرسد که زمان زیادی تا برتری کامل هوش مصنوعی بر انسانها در زمینههایی مانند ریاضیات و برنامهنویسی باقی نمانده است.