هوش مصنوعی

Stability AI از StableLM به عنوان جایگزین متن باز ChatGPT رونمایی کرد

شرکت Stability AI به تازگی یک خانواده متن باز از مدل های زبانی هوش مصنوعی را منتشر کرده است که StableLM نام دارد. این شرکت امیدوار است که با این محصول بتواند اثری شبیه به Stable Diffusion در دنیای مدل های متن باز تصویری را تکرار کند. StableLM به خاطر ماهیت خود می تواند برای تولید جانشین های ChatGPT استفاده شود.

به گزارش آرس تکنیکا، مدل های StableLM در‎حال حاضر درحالت آلفا قرار دارند و با 3 میلیارد و 7 میلیارد پارامتر در دسترس قرار گرفته اند. Stability AI وعده داده است که در آینده مدل هایی با 15 و 65 میلیارد پارامتر را هم عرضه می کند. این مدل ها با مجوز Creative Commons BYSA4.0 منتشر شده اند، بدین معنی که استفاده از آن ها با اشاره به سازنده اصلی و نشر مجدد از طریق همین مجوز مجاز است.

StableLM درست مثل GPT4، محصول شرکت OpenAI، با پیش بینی واژه بعدی در یک جمله دست به تولید متن می زند. این خانواده البته درواقع بیشتر سعی کرده است که با وجود در اختیار داشتن پارامترهای کمتر، عملکردی شبیه به GPT3 داشته باشد. GPT3 حدود 175 میلیارد پارامتر دارد.

ساخت StableLM با ملاحظات فراوان صورت گرفته است

این پارامترها متغیرهایی هستند که مدل های زبانی از آن ها برای آموزش داده ها استفاده می کنند. استفاده از پارامترهای کمتر می تواند به کوچک تر و بهینه ترشدن مدل ها کمک کند، اما اگر بخواهیم عملکردی مشابه با مدل های بزرگ تر داشته باشیم، باید آن ها را با مهارت و دقت بسیار بالا مهندسی کنیم.

Stability AI می گوید StableLM را روی مجموعه تازه ای از داده های آزمایشی بر پایه مجموعه متن بازی از داده ها موسوم به The Pile آموزش داده است. این شرکت ادعا می کند که غنای این داده ها عامل اصلی عملکرد شگفت انگیز این مدل کوچک بوده است.

وب سایت آرس تکنیکا می گوید در آزمایشی که با مدل 7 میلیارد پارامتری StableLM انجام داده، دریافته است که این مدل عملکردی بهتر از مدل 7 میلیارد پارامتری LLaMA شرکت متا دارد، بااین حال مدل GPT3 احتمالاً توانمندتر و انعطاف پذیرتر است.

جزئیات فنی کامل خانواده StableLM قرار است در آینده نزدیک به اشتراک گذاشته شود.

مقالات مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا