مایکروسافت مدل زبانی کوچک Phi2 را معرفی کرد؛ قدرتمندتر از Gemini Nano
مایکروسافت از انتشار مدل زبانی کوچک Phi2 خود با 2.7 میلیارد پارامتر خبر داد. Phi2 یک مدل متن به متن هوش مصنوعی است که می توان آن را روی یک لپ تاپ یا گوشی موبایل اجرا کرد. پیش ازاین، مایکروسافت مدل های Phi1 و Ph1.5 را نیز با 1.3 میلیارد پارامتر منتشر کرده بود. مدل هوش مصنوعی جدید مایکروسافت از Gemini Nano2 گوگل و Llama2 متا عملکرد بهتری دارد.
در چند ماه گذشته، مایکروسافت مجموعه ای از مدل های زبانی کوچک (SLM) به نام Phi را منتشر کرده است. Phi1 ابتدا با 1.3 میلیارد پارامتر یا اتصال بین نورون های مصنوعی منتشر شد و مخصوص کدنویسی پایتون بود. در شهریورماه نیز مایکروسافت ریسرچ مدل Phi1.5 را با 1.3 میلیارد پارامتر منتشر کرد که با یک داده جدید آموزش دیده بود. با وجود اندازه کوچک، Phi1.5 عملکردی تقریباً پیشرفته را در مقایسه با سایر مدل های با اندازه مشابه ارائه می کرد.
براساس بلاگ رسمی مایکروسافت ریسرچ، عملکرد مدل Phi2 با 2.7 میلیارد پارامتر را می توان با سایر مدل های بسیار بزرگ تر ازجمله مدل Llama 27B متا و حتی مدل Mistral7B با 7 میلیارد پارامتر مقایسه کرد.
مقایسه مدل زبانی کوچک Phi2 با سایر مدل های مشابه
بنچمارک های مدل زبانی کوچک Phi2 و سایر مدل ها
چند روز پیش، گوگل مجموعه مدل های زبان Gemini را معرفی کرد. Gemini Nano کارآمدترین مدل گوگل است که می تواند مستقیماً روی تراشه موبایل اجرا شود. مدل زبانی کوچک Gemini Nano ویژگی هایی مانند خلاصه سازی متن، پاسخ های هوشمند متنی و تصحیح دستور زبان پیشرفته را امکان پذیر می کند. مدل نانو دو نسخه دارد که نسخه نانو دارای پارامترهای بیشتر است.
به گفته مایکروسافت، مدل جدید Phi2 به رغم اندازه کوچک تر، مطابق یا حتی بهتر از Gemini Nano2 گوگل است. علاوه بر عملکرد بهتر Phi2 نسبت به Gemini Nano2، این مدل از مدل های Mistral و Llama2 نیز در اکثر معیارها پیشی می گیرد.
بااین حال، به رغم عملکرد قدرتمند مدل جدید مایکروسافت، Phi2 محدودیت بزرگی دارد؛ درحال حاضر این مدل فقط برای اهداف تحقیقاتی مجوز فعالیت دارد و نمی توان برای استفاده تجاری از آن بهره مند شد.