مایکروسافت از مدل هوش مصنوعی Phi3vision رونمایی کرد
مایکروسافت نسخه جدیدی از مدل زبانی کوچک Phi3 خود را معرفی کرد که Phi3vision نام دارد. این نسخه جدید می تواند به تصاویر نگاه کند و درباره آن اطلاعاتی به شما ارائه کند.
Phi3vision یک مدل چندوجهی است (به این معنی که می تواند هم متن و هم تصاویر را درک کند) و بهترین استفاده را در گوشی های موبایل ارائه می کند. مایکروسافت می گوید Phi3vision که اکنون به صورت پیش نمایش عرضه شده است، یک مدل 4.2 میلیارد پارامتری است که می تواند وظایف استدلال بصری کلی مانند پرسیدن سؤال در مورد نمودارها یا تصاویر را انجام دهد.
البته Phi3vision به مراتب بسیار کوچک تر از سایر مدل های هوش مصنوعی متمرکز بر تصویر مانند DALLE یا Stable Diffusion است. برخلاف آن مدل ها، Phi3vision توانایی تولید تصویر ندارد، اما می تواند محتوای یک تصویر را درک کند و آن را برای کاربر تجزیه و تحلیل کند.
مایکروسافت در ماه آوریل Phi3 را با عرضه Phi3mini، کوچکترین مدل این خانواده با 3.8 میلیارد پارامتر معرفی کرد. خانواده Phi3 دو عضو دیگر نیز دارد: Phi3small (7 میلیارد پارامتر) و Phi3medium (14 میلیارد پارامتر).
Phi3vision اکنون به صورت پیش نمایش در دسترس است و درباره زمان عرضه جهانی آن اطلاعاتی وجود ندارد. سایر اعضای این خانواده نیز از طریق کتابخانه مدل Azure در دسترس هستند.