هوش مصنوعی

بایدو از مدل ERNIE 5 رونمایی کرد؛ حریف قابلی برای GPT-5 و جمینای

فقط یک روز بعد از عرضه مدل GPT-5.1 از سوی OpenAI، کمپانی چینی بایدو از مدل هوش مصنوعی تازه‌اش با نام ERNIE 5.0 پرده‌برداری کرد.

مدل ERNIE 5.0 یک سیستم جامع و منحصر به فرد است؛ به این معنا که این مدل به‌منظور پردازش و تولید همزمان محتوا در چهار بُعد، شامل متن، تصویر، صوت و ویدیو توسعه یافته است. همچنین بر خلاف مدل قبلی این شرکت، یعنی ERNIE-4.5-VL که به‌صورت متن‌باز ارائه شد، ERNIE 5.0 به‌طور انحصاری قابل دسترسی است و تنها از طریق وب‌سایت ERNIE Bot و پلتفرم ابری Qianfan (از طریق API) قابل استفاده خواهد بود. بایدو همچنین نسخه‌ای به نام ERNIE 5.0 Preview 1022 را معرفی نموده که به‌خصوص برای کارهای سنگین متنی بهینه‌سازی شده است.

رقابت مدل جدید ERNIE 5.0 با GPT-5

براساس ارزیابی‌های مستند بایدو، ERNIE 5.0 در انجام محدوده وسیعی از وظایف عملکردی برابر یا حتی بالاتر از مدل رده‌بالای OpenAI، یعنی GPT-5-High و همچنین Gemini 2.5 Pro به نمایش گذاشته است. نقطه قوت اصلی بایدو در زمینه‌هایی است که برای کسب‌وکارها از اهمیت بالایی برخوردارند: این مدل در ارزیابی‌های مربوط به OCRBench (تشخیص نوری کاراکترها) و DocVQA (پاسخ به سؤالات بر اساس اسناد) موفق به شکست رقبای آمریکایی خود شده است.

علاوه بر این، در ارزیابی ChartQA، مدل بایدو در زمینه استدلال و تفسیر داده‌های ساختار یافته از نمودارها عملکرد بهتری را نشان داده است. بایدو ادعا می‌کند که این ویژگی‌ها ERNIE 5.0 را به گزینه‌ای بی‌نظیر برای پردازش خودکار اسناد و تحلیل‌های مالی تبدیل کرده است.

در حوزه تولید تصویر، این مدل با Veo3 شرکت گوگل برابری کرده یا حتی در برخی موارد از آن پیشی گرفته است. نتایج در زمینه کارهای صوتی و زبانی نیز به شکل رقابتی اعلام شده‌اند، هرچند محور اصلی بر روی درک بصری و مدیریت اسناد متمرکز بوده است.

بایدو ERNIE 5.0 را به‌عنوان یک مدل پریمیوم با قیمت‌گذاری قابل توجه معرفی کرده است که به‌طور مشهودی گران‌تر از نسخه‌های پیشین مانند ERNIE 4.5 Turbo به حساب می‌آید. با این حال، هزینه آن نسبت به رقبای عمده امریکایی، هنوز هم به‌عنوان یک گزینه رقابتی و ارزان‌تر قابل توجه است.

در جدول زیر، هزینه استفاده (به‌ازای هر ۱ میلیون توکن) مقایسه شده است:

مدل هزینه ورودی (۱ میلیون توکن) هزینه خروجی (۱ میلیون توکن)
ERNIE 5.0 (Baidu) $0.85 $3.40
GPT-5.1 (OpenAI) $1.25 $10.00
Gemini 2.5 Pro (Google) $1.25 (تا 200k) $10.00 (تا 200k)
Claude Opus 4.1 (Anthropic) $15.00 $75.00
ERNIE 4.5 Turbo (Baidu) $0.11 $0.45

معرفی این مدل بخشی از یک استراتژی وسیع‌تر بایدو به شمار می‌رود. این غول چینی در عین حال محصولات دیگری مانند MeDo (پلتفرم ساخت اپلیکیشن بدون کد) و Oreate را به رونمایی جهانی رسانیده و سرویس تاکسی خودران Apollo Go را نیز به ۲۲ شهر دیگر گسترش داده است.

مقالات مرتبط

دکمه بازگشت به بالا