بایدو مدل هوش مصنوعی PP-OCRv5 را معرفی کرد؛ تخصص در خواندن متن

سپتامبر 15, 2025اخرین به روز رسانی: سپتامبر 15, 2025

1 دقیقه مطالعه کنید

بایدو از مدل هوش مصنوعی PP-OCRv5 رونمایی کرد؛ متخصص متن‌خوانی

پس از رونمایی از مدل Ernie X1.1، بایدو اکنون نسخه جدید PP-OCRv5 را به بازار معرفی کرده است. PP-OCRv5 یکی از مدل‌های تشخیص نوری حروف (OCR) به شمار می‌آید که هم‌اکنون برای استفاده عموم در دسترس کاربران از طریق Hugging Face قرار گرفته است.

بر اساس گزارش گیزموچاینا، ویژگی بارز این مدل توانایی استثنایی آن در خواندن متون است. علاوه بر این، طراحی آن به گونه‌ای است که سبک و کم حجم باشد. یکی از چالش‌های مدل‌های بزرگ بینایی زبان، در دقت عمل و جزئیات مانند خواندن متن‌های ساختاریافته می‌باشد. اما PP-OCRv5 این مشکل را برای کاربران مرتفع می‌سازد.

با قابلیت‌های مدل هوش مصنوعی PP-OCRv5 از بایدو آشنا شوید

مدل هوش مصنوعی PP-OCRv5 به‌طور خاص برای حل این محدودیت‌ها طراحی شده است. عملکرد این مدل در دو مرحله اصلی صورت می‌گیرد: ابتدا محل متن را در تصویر شناسایی می‌کند و سپس به خواندن خود متن می‌پردازد.

این روش به مدل اجازه می‌دهد تا دقیقا مکان متن را تشخیص دهد. همچنین این فرآیند در استخراج داده‌ها از اسناد یا تحلیل فرم‌ها بسیار کارآمد است. مدل PP-OCRv5 تنها ۰.۰۷ میلیارد پارامتر دارد که نسبت به مدل‌های مطرح در این زمینه، بسیار کم به حساب می‌آید.

بایدو این مدل را بر روی سیستم‌های موبایل آزمایش کرده و مشاهده شده که توانایی پردازش بیش از ۳۷۰ کاراکتر در ثانیه را بر روی پردازنده اینتل Xeon دارد. این نشان می‌دهد که می‌توان این مدل را روی کامپیوترهای عمومی و حتی دستگاه‌های لبه فناوری بدون نیاز به دیتاسنترهای بزرگ به اجرا درآورد.

این شرکت، PP-OCRv5 را در زمینه‌های OCR با مدل‌های معروفی همچون جمینای ۲.۵ پرو و GPT-4o مقایسه کرده و این مدل توانسته عملکرد مطلوبی از خود نشان دهد. علاوه بر این، مدل قادر است متون چاپی و دست‌نویس را به‌صورت مؤثر پردازش نماید و پشتیبانی از بیش از ۴۰ زبان را نیز فراهم می‌آورد.

بایدو این مدل را از طریق Hugging Face برای همگان در دسترس قرار داده است و توسعه‌دهندگان می‌توانند به راحتی از آن بهره‌برداری کنند.

سپتامبر 15, 2025اخرین به روز رسانی: سپتامبر 15, 2025

1 دقیقه مطالعه کنید

بایدو مدل هوش مصنوعی PP-OCRv5 را معرفی کرد؛ تخصص در خواندن متن

با قابلیت‌های مدل هوش مصنوعی PP-OCRv5 از بایدو آشنا شوید

پردازنده اینتل برای گیمینگ؛ کدام سری واقعاً بازی را عوض می‌کند؟

داستان موفقیت هلیکس گیم در صنعت گیم‌هاستینگ ایران

راز کارت های تاروت در Red Dead Redemption 2 که شما ندیدید!

چرا همه گیمرها یک شبه به سمت این لپ تاپ لنوو هجوم بردند

راز خرید یک لپ تاپ گیمینگ واقعی که کسی به شما نمی گوید

مایکروسافت قابلیت «Copilot Mode» را به مرورگر Edge اضافه کرد

مدیر عامل ناشر GTA: هوش مصنوعی صرفاً یک «تردستی» محسوب می‌شود

احتمال انتشار بسته الحاقی مورد نظر برای بازی Silent Hill 2 Remake تقویت شد

این استاد ژاپنی از یک بازی ترسناک برای تدریس زبان در کنسول PS4 بهره می‌برد

پیشرفت محققان چینی؛ شبیه‌سازی شیمی کوانتومی به کمک ابرکامپیوتر کلاسیک

مادربرد Z890 AORUS Tachyon Ice از گیگابایت به رکورد جهانی DDR5-13010 دست یافت

بازگشت پورشه به استفاده از پیشرانه‌های بنزینی؛ کناره‌گیری از آرزوی خودروهای الکتریکی

با قابلیت‌های مدل هوش مصنوعی PP-OCRv5 از بایدو آشنا شوید

بازار هوش مصنوعی به مرحله حباب رسیده است

روند کاهشی قیمت RX 9070 XT ادامه دارد؛ اما فاصله با هدف قیمتی 599 دلاری همچنان باقیست

مقالات مرتبط

هوش مصنوعی Sora احتمالاً به زودی برای تمام کاربران عرضه می شود

گوگل از هوش مصنوعی ساخت ویدیو VideoPoet رونمایی کرد + ویدیو

غول های فناوری چگونه با هکرها امنیت هوش مصنوعی را افزایش می دهند؟

می‌خواهیم صنعت آموزش را متحول کنیم