دیپ مایند گوگل روشی جدید برای آموزش هوش مصنوعی پیشنهاد می دهد

دی 17, 1403اخرین به روز رسانی: اردیبهشت 18, 1404

0 2 دقیقه خوانده شد

دیپ‌مایند گوگل روشی جدید برای آموزش هوش مصنوعی پیشنهاد می‌دهد

بسیاری از کارشناسان حوزه هوش مصنوعی مانند «ایلیا ساتسکیور»، از بنیان گذاران OpenAI، می گویند فرایند آموزش هوش مصنوعی با روش های قدیمی به اوج خود رسیده و دیگر نمی توان مدل های قدرتمندتری با آنها توسعه داد. اکنون محققان دیپ مایند گوگل می گویند می توان از خروجی های مدل های «استدلال گر» مانند o1 به عنوان منابع داده آموزشی جدید هوش مصنوعی استفاده کرد.

براساس گزارش بیزنس اینسایدر، تمام داده های مفید موجود در اینترنت تاکنون برای آموزش مدل های هوش مصنوعی استفاده شده است. این فرایند که پیش آموزش (Pretraining) شناخته می شود، بسیاری از دستاوردهای اخیر هوش مصنوعی ازجمله ChatGPT را ایجاد کرد اما اخیراً ارتقاهای هوش مصنوعی دیگر شتاب قبل را ندارد و کارشناسان می گویند دوره پیش آموزش به پایان نزدیک شده است.

باتوجه به اینکه شرکت های بزرگ فناوری تریلیون ها دلار در این فناوری سرمایه گذاری کرده اند، کاهش پیشرفت مدل های هوش مصنوعی می تواند هولناک باشد اما محققان می گویند راه جدیدی برای آموزش و توسعه مدل های هوش مصنوعی وجود دارد.

روش جدید محققان دیپ مایند برای آموزش هوش مصنوعی

مدل های جدید مانند o1 و o3 از شرکت OpenAI از روش جدیدی برای پاسخ به درخواست های کاربران استفاده می کنند که به آن پردازش زمان آموزش یا استدلال (testtime or inferencetime compute) می گویند.

در این روش، هوش مصنوعی درخواست های شما را به بخش های کوچک تری تقسیم و هرکدام را به پرامپت جدیدی تبدیل می کند. هر مرحله نیاز به اجرای درخواست جدیدی دارد که مرحله استنتاج در هوش مصنوعی شناخته می شود. این امر زنجیره ای از استدلال ها را ایجاد می کند که در آن هر بخش از مسئله حل می شود. مدل تا زمانی که هر قسمت را حل نکند و بتواند درنهایت پاسخ نهایی بهتری ارائه بدهد، به مرحله بعدی نمی رود.

طبق بنچمارک های منتشرشده مدل های جدید اغلب، به ویژه درمورد سؤالات ریاضی، خروجی های بهتری نسبت به مدل های قبلی تولید می کنند. محققان می گویند این خروجی های باکیفیت می توانند همان داده های آموزشی جدید باشند؛ به عبارتی این اطلاعات جدید و عظیم را می توان به فرایند آموزش مدل های هوش مصنوعی دیگر تزریق کرد تا حلقه خودبهبودی تکراری ایجاد کنیم.

برای مثال اگر خروجی های مدل o1 بهتر از GPT4 باشد، می توان از این خروجی های جدید برای آموزش مدل های هوش مصنوعی آینده استفاده کرد یا فرض کنید o1 امتیاز 90 درصد را در یک بنچمارک هوش مصنوعی خاص دریافت می کند، می توانید این پاسخ ها را جمع کنید و به GPT4 بدهید تا آن مدل نیز به امتیاز 90 درصد برسد.

البته به نظر می رسد اکنون نیز برخی شرکت ها دارند از این روش برای توسعه مدل های خود بهره می برند. محققان احتمال می دهند این داده های مصنوعی بهتر از آنچه در اینترنت وجود دارد، باشند.

دی 17, 1403اخرین به روز رسانی: اردیبهشت 18, 1404

0 2 دقیقه خوانده شد

روش جدید محققان دیپ مایند برای آموزش هوش مصنوعی

تلویزیون های ال جی به زودی سرویس Xbox Cloud Gaming را دریافت می کنند

سامسونگ رسماً تاریخ معرفی سری گلکسی S25 را اعلام کرد

مقالات مرتبط

اپل اینتلیجنس شاید در اروپا فقط برای کاربران مک منتشر شود

نیویورک تایمز OpenAI را به حذف عمدی شواهد مربوط آموزش هوش مصنوعی متهم کرد

امکان ویرایش تصویر DALLE با ChatGPT فراهم شد + ویدیو

12تا از بهترین برنامه های هوش مصنوعی در جهان که باید بشناسید!

دیدگاهتان را بنویسید لغو پاسخ