علی بابا چین مدل هوش مصنوعی استدلال گر تصویری معرفی کرد
Alibaba، غول فناوری چینی، مدل جدید هوش مصنوعی از سری Qwen به نام QVQMax را معرفی کرد. این مدل استدلالگر تصویر است و می تواند محتوای عکس ها و فیلم ها را درک کند و با تحلیل و استدلال، اطلاعاتی درباره آنها ارائه دهد.
براساس گزارش Neowin، علی بابا می گوید با مدل QVQMax شکاف مدل های هوش مصنوعی مبتنی بر متن و اطلاعات دنیای واقعی در تصاویر را پر می کند. این هوش مصنوعی با قابلیت استدلال بصری می تواند واقعیت های جهان را ببیند، بفهمد و درباره آنها فکر کند. این شرکت چینی ادعا می کند این مدل در تجزیه وتحلیل تصاویر و شناسایی عناصر کلیدی عملکرد خیلی خوبی دارد و در مواردی می توان از آن برای تصویرسازی و تولید فیلم نامه نیز استفاده کرد.
هوش مصنوعی استدلالگر تصویری Alibaba
مانند سایر چت بات های هوش مصنوعی، QVQMax نیز می تواند در کارهای مختلف کمکتان کند و با اضافه شدن این قابلیت تصویری می توانید کارهای بیشتری را به آن بسپارید؛ برای مثال عکس مسائل ریاضی و فیزیک همراه نمودارها را برایش بفرستید.
علی بابا QVQMax را اولین نسخه از مدل استدلالگر تصویری خود نامیده است و به مرور می خواهد آن را در چندین مرحله بهبود دهد. ابتدا Alibaba می خواهد دقت تشخیص تصویر را بهبود ببخشد. سپس مدل را در حل مسائل چندمرحله ای و پیچیده بهتر کند. درنهایت قصد دارد این مدل را از تعاملات مبتنی بر متن فراتر برده و آن را به قابلیت هایی مثل تولید بصری مجهز کند.
برای استفاده از QVQMax، ابتدا باید به chat.qwen.ai بروید، روی منوی مدل ها در بالا سمت چپ کلیک کنید، گزینه «Expand more models» را بزنید و QVQMax را کنید. برای آنکه بهتر از قابلیت های این مدل استفاده کنید، بهتر است تصویری را پیوست کنید سپس از مدل درباره آن سؤال کنید.
علی بابا چندی قبل نیز مدل Qwen2.5Max را منتشر کرد که در بنچمارک های مختلف از مدل V3 دیپ سیک، GPT4o و Llama3.1405B متا بهتر عمل می کند.