کامپیوتر و سخت افزار

تراشه M5 عملکردی چهار برابر سریع‌تر از M4 در اجرای مدل‌های هوش مصنوعی دارد

در آخرین به‌روزرسانی وبلاگ پژوهشی خود، اپل به بیان توانایی‌های برجسته تراشه M5 در اجرای مدل‌های زبانی بزرگ پرداخته است. این گزارش که بر پایه فریم‌ورک اختصاصی و متن‌باز اپل به نام MLX نوشته شده، نشان می‌دهد که مک‌بوک‌های مجهز به M5 در حوزه‌های سنگین پردازش هوش مصنوعی، بهبود عملکردی قابل توجهی را نسبت به نسل قبل ارائه می‌دهند.

براساس تجزیه و تحلیل‌های اخیر اپل، تراشه M5 در بنچمارک «مدت زمان موردنیاز تا آغاز تولید اولین توکن» (TTFT) به عملکردی چشمگیر دست یافته و بین ۳.۳ تا ۴.۱ برابر سریع‌تر از M4 عمل می‌کند. TTFT زمانی است که کاربر دکمه اینتر را فشار می‌دهد و در انتظار آغاز نوشتن هوش مصنوعی است. این فرایند به شدت به محاسبات وابسته بوده و نیازمند انجام عملیات ضرب ماتریس‌های پیچیده است.

اپل برای مقابله با این چالش، شتاب‌دهنده‌های عصبی GPU جدیدی را در تراشه M5 تعبیه کرده که به طور خاص وظیفه انجام عملیات ضرب ماتریس را به عهده دارند. طبق نمودارهای منتشرشده توسط اپل، نتایج زیر برای مدل‌های مختلف هوش مصنوعی ثبت شده است:

  • مدل Qwen 14B: زمان پردازش از ۳۵.۱۵ ثانیه در M4 به ۸.۶۶ ثانیه در M5 کاهش یافته است (۴.۱ برابر سریع‌تر).
  • مدل Qwen 8B: بهبود از ۱۸.۶ ثانیه به ۴.۶۹ ثانیه (۴ برابر سریع‌تر).
  • مدل سنگین Qwen 30B: بهبود از ۹.۳۷ ثانیه به ۲.۶۶ ثانیه (۳.۵ برابر سریع‌تر).

این بدین معناست که تأخیر آزاردهنده‌ای که در حین کار با مدل‌های محلی روی لپ‌تاپ احساس می‌کردید، به طرز چشمگیری کاهش یافته است.

افزایش سرعت پردازش هوش مصنوعی در تراشه M5 اپل

برعکس مرحله اول (TTFT)، فرآیند تولید کلمات بعدی (تکمیل پاسخ) به توانایی حافظه لپ‌تاپ وابسته است. در این بخش، اهمیت سرعت پردازنده به مراتب کاهش می‌یابد و این مسئله بستگی به این دارد که اطلاعات چقدر سریع می‌توانند از حافظه رم به پردازنده منتقل شوند.

تراشه M5 با پهنای باند حافظه ۱۵۳ گیگابایت‌برثانیه مجهز شده است که نسبت به ۱۲۰ گیگابایت‌برثانیه در M4، بهبود تقریباً ۲۸ درصدی را به همراه دارد. به همین دلیل، سرعت تولید متن نیز در بنچمارک‌ها به میزان ۱.۱۹ تا ۱.۲۷ برابر (حدود ۱۹ تا ۲۷ درصد) تقویت شده است.

جدول زیر، جزئیات خاص تست‌های انجام‌شده بر روی مک‌بوک پرو با ۲۴ گیگابایت رم را به نمایش می‌گذارد:

مدل هوش مصنوعی بهبود سرعت شروع (TTFT) بهبود سرعت تولید متن مصرف حافظه (GB)
Qwen3-1.7B ۳.۵۷ برابر ۱.۲۷ برابر ۴.۴۰
Qwen3-8B ۳.۶۲ برابر ۱.۲۴ برابر ۱۷.۴۶
Qwen3-8B ۳.۹۷ برابر ۱.۲۴ برابر ۵.۶۱
Qwen3-14B ۴.۰۶ برابر ۱.۱۹ برابر ۹.۱۶
GPT-OSS 20B ۳.۳۳ برابر ۱.۲۴ برابر ۱۲.۰۸
Qwen3-30B (MoE) ۳.۵۲ برابر ۱.۲۵ برابر ۱۷.۳۱

جالب است بدانید که مک‌بوک پرو با ۲۴ گیگابایت رم موفق به اجرای مدل سنگین 30 میلیارد پارامتری شده و تنها ۱۷.۳۱ گیگابایت از حافظه را مصرف کرده است؛ در حالی‌که همچنان فضای کافی برای سیستم‌عامل فراهم است.

مقالات مرتبط

دکمه بازگشت به بالا