هوش مصنوعی OpenAI o3 برای تولید هر پاسخ 1000 دلار هزینه میکند
چند روز قبل OpenAI از مدل پیشرفته o3 خود رونمایی کرد که فقط افراد کمی آن را تست کردهاند، بااینحال بنچمارکها از عملکرد خیرهکننده آن خبر میدهند. این مدل نشان میدهد که هنوز میتوان با افزایش مقیاس دادههای آموزشی، مدلهای پیشرفتهتری تولید کرد؛ اما یک مسئله وجود دارد و آن نیز هزینه بسیار بالای این مدل برای تولید هر پاسخ است.
براساس گزارش تک کرانچ، OpenAI برای آموزش مدل o3 از روشی موسوم به «مقیاسبندی زمان آموزش» یا Test-time scaling بهره برده است و بنچمارکها نیز موفقیتآمیزبودن این روش را نشان میدهند. برای مثال مدل o3 در آزمون ریاضی دشواری که هیچ مدل هوش مصنوعی دیگری در آن امتیازی بیش از 2 درصد کسب نکرده بود، 25 درصد امتیاز گرفته است.
نکته عجیبتر این است که به گفته «نوام براون»، یکی از سازندگان مدلهای OpenAI، این شرکت فقط 3 ماه پس از رونمایی o1، مدل جدید o3 را معرفی کرده که برای چنین جهش بزرگی بازه زمانی نسبتاً کوتاهی است.
هزینه بالای مدل o3 برای تولید هر پاسخ
برخی از کارشناسان حوزه هوش مصنوعی مانند «ایلیا ساتسکیور»، از بنیانگذاران OpenAI، اعتقاد دارند که روش فعلی آموزش مدلهای هوش مصنوعی به بنبست رسیده است و نمیتوان با همین روش مدلهای قویتری تولید کرد. حالا مدل o3 در مدت زمان کمی توانسته است نسبت به مدل قبلی خود عملکرد بسیار بهتری ارائه دهد.
«جک کلارک»، یکی از بنیانگذاران آنتروپیک، نیز دیروز در یک مطلب وبلاگی گفت که o3 شاهدی است برای اینکه پیشرفت هوش مصنوعی در سال 2025 سریعتر از سال 2024 خواهد بود. کلارک میگوید که در سال آینده میلادی، دنیای هوش مصنوعی روش مقیاسبندی زمان آزمایش و روشهای سنتی مقیاسبندی را باهم ترکیب خواهد کرد تا بازدهی بیشتری از مدلهای هوش مصنوعی بهدست آورد.
مقیاسبندی زمان آموزش به این معنی است که OpenAI از توان پردازشی بیشتری در مرحله استنتاج ChatGPT استفاده میکند. البته دقیقاً مشخص نیست که در پشت صحنه چه اتفاقی میافتد: OpenAI یا از تراشههای کامپیوتری بیشتر و قویتری برای پاسخ به سؤال کاربر بهره میبرد یا آن تراشهها را برای مدت زمان طولانیتری (در برخی موارد 10 تا 15 دقیقه) اجرا میکند. بااینحال هر کاری که OpenAI دارد انجام میدهد، بسیار هزینهبر است؛ نمودار پایین را ببینید:
کلارک به عملکرد o3 در بنچمارک ARC-AGI (آزمونی دشوار که برای ارزیابی پیشرفتها در زمینه رسیدن به هوش جامع مصنوعی (AGI) استفاده میشود) اشاره میکند. البته گذراندن این آزمون، به گفته سازندگان آن، به این معنا نیست که یک مدل هوش مصنوعی به AGI دست یافته است، بلکه یکی از راههای سنجش پیشرفت به سمت این هدف مبهم است.
بااینحال، نمرات مدل o3 در این بنچمارک از تمام مدلهای قبلی بیشتر است و موفق به کسب 88 درصد امتیاز شد. برای مثال نمره مدل o1 حدود 32 درصد است. البته شاید این خبر خوبی باشد، اما محور x لگاریتمی این نمودار هشداردهنده است. این مدل برای تولید هر پاسخ به بیش از 1000 دلار نیاز دارد. درحالیکه مدل o1 حدود 5 دلار و o1-mini فقط چند سنت هزینه دارد.
اگرچه OpenAI از توان پردازشی گرانی برای هر پاسخ استفاده میکند، نمیتوان عملکرد خارقالعاده مدل آن را منکر شد. اما بهجاست که چند سؤال را مطرح کنیم: اگر مدل o3 چنین هزینهای دارد، OpenAI در مدلهای آتی o4 و o5 چقدر میخواهد توان پردازشی را بیشتر کند و به چه میزان هزینهای؟ مطمئناً این هزینهها در آخر باعث میشود اشتراکهای این مدلها بسیار گران باشند و تمام کاربران نتوانند از آن استفاده کنند.