هوش مصنوعی

OpenAI از مدل هوش مصنوعی استدلال گر o3 رونمایی کرد

در آخرین روز از رویداد 12 روزه معرفی محصولات و قابلیت های جدید مدل های هوش مصنوعی OpenAI، این شرکت بزرگ ترین خبر خود را اعلام کرد. شب گذشته از مدل استدلال گر o3 به عنوان جایگزین o1 رونمایی شد، اما هنوز فاصله زیادی تا عرضه عمومی آن داریم.

به گزارش تک کرانچ، مدل هوش مصنوعی o3 که در واقع خانواده ای از مدل ها شامل o3 و o3mini است. مدل مینی کوچک تر و سبک تر خواهد بود تا برای امور خاص کارایی بیشتری داشته باشد. OpenAI ادعا می کند که خانواده o3 حداقل در برخی شرایط خاص به سطح هوش جامع مصنوعی (AGI) نزدیک می شود. اما البته هنوز کاستی های زیادی وجود دارد و راه زیادی تا رسیدن به یک مدل AGI واقعی وجود دارد.

مدل هوش مصنوعی o3 جانشین o1 است، اما چرا نام آن o2 نیست؟ احتمالاً مشکلات حقوقی مانع از این مسئله شده است. طبق گزارش نشریه اینفورمیشن، OpenAI از روی o2 پریده تا با اپراتور مخابراتی بریتانیایی O2 دچار درگیری حقوقی نشود. «سم آلتمن»، مدیرعامل OpenAI به نحوی این مسئله را در پخش زنده این شرکت تأیید کرد.

عرضه پیش نمایش مدل هوش مصنوعی OpenAI o3

بنچمارک ریاضیات و تأخیر

مدل های o3 و o3mini هنوز به صورت گسترده در دسترس قرار نگرفته اند، اما کارشناسان ایمنی می توانند برای دسترسی به پیش نمایش o3mini از امروز نام نویسی کنند. پیش نمایش o3 در آینده عرضه می شود، اما OpenAI هنوز تاریخی اعلام نکرده است. آلتمن می گوید برنامه آنها این است که o3mini در اواخر ژانویه و پس از آن o3 در دسترس قرار بگیرد.

مدل هوش مصنوعی o3 با روشی موسوم به «یادگیری تقویتی» آموزش داده شده است تا پیش از پاسخ دادن با فرایندی که OpenAI آن را «زنجیره خصوصی تفکر» می نامد، فکر کند. این مدل قادر است در حین انجام یک کار استدلال و قدم های بعدی را از پیش برنامه ریزی کند. در نتیجه می تواند با برداشتن مجموعه ای از قدم ها یک مسئله را حل کند.

بنچمارک ARCAGI

یکی از تفاوت های o3 با o1 قابلیت مدل جدید در تنظیم زمان استدلال است. این مدل ها را می توان تنظیم کرد تا زمان رایانش (یا تفکر) کوتاه، متوسط یا طولانی داشته باشند. هرچه زمان بیشتری در اختیار مدل o3 برای فکرکردن وجود داشته باشد، کارها را بهتر انجام می دهد.

در خصوص ادعای نزدیک شدن o3 به سطح AGI، این مدل در بنچمارک ARCAGI که نشان می دهد یک سیستم هوش مصنوعی تا چه حد می تواند مهارت های جدید را خارج از داده های آموزشی خود یاد بگیرد، به امتیاز 87.5 درصد دست یافته است. این امتیاز البته در حالت تفکر طولانی به دست آمده است. o3 در بدترین حالت (با زمان تفکر کوتاه) 3 برابر عملکرد بهتری نسبت به o1 دارد.

مقالات مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا