هوش مصنوعی

مدل دیپ‌سیک Math-V2 با دستیابی به عملکردی معادل مدال طلای المپیاد ریاضی رونمایی شد

شرکت چینی دیپ‌سیک خبر از عرضه نخستین مدل متن‌باز جهانی داده است که قادر به عملکردی در سطح مدال طلا در آزمون‌های المپیاد بین‌المللی ریاضی می‌باشد.

به گزارش نشریه SCMP، دیپ‌سیک مدل Math-V2 خود را با یک مجوز منعطف به‌صورت کاملاً متن‌باز روی پلتفرم‌های Hugging Face و GitHub ارائه کرده است. این مجوز به کاربران این امکان را می‌دهد که مدل را برای نیازهای مختلف سفارشی‌سازی کرده و دوباره به کار گیرند. دیپ‌سیک اکنون ادعا می‌کند که مدل Math-V2 توانایی کسب مدال طلا در المپیاد بین‌المللی ریاضی را دارد.

مدل Math-V2 دیپ‌سیک می‌تواند در المپیاد ریاضی مدال طلا کسب کند

المپیاد بین‌المللی ریاضی که از سال ۱۹۵۹ به‌طور سالانه برگزار می‌شود، به‌عنوان معتبرترین رویداد ریاضی در سطح جهان تلقی می‌گردد، حتی برای سیستم‌های هوش مصنوعی. طبق اظهارات «هوانگ ییچن» پژوهشگر هوش مصنوعی در دانشگاه هاروارد و «یانگ لین» استاد علوم کامپیوتر در دانشگاه UCLA، حل سؤالات این المپیاد به بینش عمیق، خلاقیت و دقت فوق‌العاده نیاز دارد.

برای اینکه سیستم‌های هوش مصنوعی قادر به کسب امتیازات بالا در این المپیاد باشند، ضروری است که استدلال و تحلیل منطقی موجود پشت پاسخ‌های خود را ارائه دهند و فقط درج پاسخ نهایی کافی نخواهد بود. حدود ۸ درصد شرکت‌کنندگانی که انسان هستند در المپیاد بین‌المللی ریاضی موفق به دریافت مدال طلا می‌شوند.

انتشار این دستاورد نوین توسط دیپ‌سیک، دسترسی توسعه‌دهندگان در سرتاسر جهان به یک مدل قوی هوش مصنوعی در زمینه ریاضی را تسهیل کرده است. این مدل چند ماه پس از آن ارائه می‌شود که کمپانی‌های آمریکایی همچون گوگل DeepMind و OpenAI هم‌زمان با مدل‌های اختصاصی خود همان موفقیت را در همان المپیاد به دست آورده بودند.

دیپ‌سیک اعلام کرده که مدل جدید این شرکت توانسته است در سؤالات المپیاد بین‌المللی ریاضی امسال و همچنین المپیاد ریاضی چین ۲۰۲۴ به سطح امتیاز مدال طلا دست یابد.

پژوهشگران دیپ‌سیک تأکید کردند که پیشرفت‌های بیشتر در قابلیت‌های ریاضی هوش مصنوعی می‌تواند تأثیر عمیقی بر تحقیقات علمی داشته باشد و مواردی همچون شبیه‌سازی‌های پیچیده و حل معضلات نظری را آسان‌تر کند.

با این حال، محققان نسبت به این مساله هشدار دادند که تعداد زیادی از سیستم‌های هوش مصنوعی موجود به‌طور عمده برای عملکرد مؤثر در معیارهای استاندارد ریاضی بهینه‌سازی شده‌اند و این مدل‌ها ممکن است امتیازات بالایی کسب کنند، بی‌آنکه واقعاً توانایی تفکر و حل مسائل عمیق را تقویت کرده باشند.

مقالات مرتبط

دکمه بازگشت به بالا