بایدو از مدل ERNIE 5 رونمایی کرد؛ حریف قابلی برای GPT-5 و جمینای

فقط یک روز بعد از عرضه مدل GPT-5.1 از سوی OpenAI، کمپانی چینی بایدو از مدل هوش مصنوعی تازهاش با نام ERNIE 5.0 پردهبرداری کرد.
مدل ERNIE 5.0 یک سیستم جامع و منحصر به فرد است؛ به این معنا که این مدل بهمنظور پردازش و تولید همزمان محتوا در چهار بُعد، شامل متن، تصویر، صوت و ویدیو توسعه یافته است. همچنین بر خلاف مدل قبلی این شرکت، یعنی ERNIE-4.5-VL که بهصورت متنباز ارائه شد، ERNIE 5.0 بهطور انحصاری قابل دسترسی است و تنها از طریق وبسایت ERNIE Bot و پلتفرم ابری Qianfan (از طریق API) قابل استفاده خواهد بود. بایدو همچنین نسخهای به نام ERNIE 5.0 Preview 1022 را معرفی نموده که بهخصوص برای کارهای سنگین متنی بهینهسازی شده است.
رقابت مدل جدید ERNIE 5.0 با GPT-5
براساس ارزیابیهای مستند بایدو، ERNIE 5.0 در انجام محدوده وسیعی از وظایف عملکردی برابر یا حتی بالاتر از مدل ردهبالای OpenAI، یعنی GPT-5-High و همچنین Gemini 2.5 Pro به نمایش گذاشته است. نقطه قوت اصلی بایدو در زمینههایی است که برای کسبوکارها از اهمیت بالایی برخوردارند: این مدل در ارزیابیهای مربوط به OCRBench (تشخیص نوری کاراکترها) و DocVQA (پاسخ به سؤالات بر اساس اسناد) موفق به شکست رقبای آمریکایی خود شده است.
علاوه بر این، در ارزیابی ChartQA، مدل بایدو در زمینه استدلال و تفسیر دادههای ساختار یافته از نمودارها عملکرد بهتری را نشان داده است. بایدو ادعا میکند که این ویژگیها ERNIE 5.0 را به گزینهای بینظیر برای پردازش خودکار اسناد و تحلیلهای مالی تبدیل کرده است.
در حوزه تولید تصویر، این مدل با Veo3 شرکت گوگل برابری کرده یا حتی در برخی موارد از آن پیشی گرفته است. نتایج در زمینه کارهای صوتی و زبانی نیز به شکل رقابتی اعلام شدهاند، هرچند محور اصلی بر روی درک بصری و مدیریت اسناد متمرکز بوده است.
بایدو ERNIE 5.0 را بهعنوان یک مدل پریمیوم با قیمتگذاری قابل توجه معرفی کرده است که بهطور مشهودی گرانتر از نسخههای پیشین مانند ERNIE 4.5 Turbo به حساب میآید. با این حال، هزینه آن نسبت به رقبای عمده امریکایی، هنوز هم بهعنوان یک گزینه رقابتی و ارزانتر قابل توجه است.
در جدول زیر، هزینه استفاده (بهازای هر ۱ میلیون توکن) مقایسه شده است:
| مدل | هزینه ورودی (۱ میلیون توکن) | هزینه خروجی (۱ میلیون توکن) |
| ERNIE 5.0 (Baidu) | $0.85 | $3.40 |
| GPT-5.1 (OpenAI) | $1.25 | $10.00 |
| Gemini 2.5 Pro (Google) | $1.25 (تا 200k) | $10.00 (تا 200k) |
| Claude Opus 4.1 (Anthropic) | $15.00 | $75.00 |
| ERNIE 4.5 Turbo (Baidu) | $0.11 | $0.45 |
معرفی این مدل بخشی از یک استراتژی وسیعتر بایدو به شمار میرود. این غول چینی در عین حال محصولات دیگری مانند MeDo (پلتفرم ساخت اپلیکیشن بدون کد) و Oreate را به رونمایی جهانی رسانیده و سرویس تاکسی خودران Apollo Go را نیز به ۲۲ شهر دیگر گسترش داده است.




