تراشه M5 عملکردی چهار برابر سریعتر از M4 در اجرای مدلهای هوش مصنوعی دارد

در آخرین بهروزرسانی وبلاگ پژوهشی خود، اپل به بیان تواناییهای برجسته تراشه M5 در اجرای مدلهای زبانی بزرگ پرداخته است. این گزارش که بر پایه فریمورک اختصاصی و متنباز اپل به نام MLX نوشته شده، نشان میدهد که مکبوکهای مجهز به M5 در حوزههای سنگین پردازش هوش مصنوعی، بهبود عملکردی قابل توجهی را نسبت به نسل قبل ارائه میدهند.
براساس تجزیه و تحلیلهای اخیر اپل، تراشه M5 در بنچمارک «مدت زمان موردنیاز تا آغاز تولید اولین توکن» (TTFT) به عملکردی چشمگیر دست یافته و بین ۳.۳ تا ۴.۱ برابر سریعتر از M4 عمل میکند. TTFT زمانی است که کاربر دکمه اینتر را فشار میدهد و در انتظار آغاز نوشتن هوش مصنوعی است. این فرایند به شدت به محاسبات وابسته بوده و نیازمند انجام عملیات ضرب ماتریسهای پیچیده است.
اپل برای مقابله با این چالش، شتابدهندههای عصبی GPU جدیدی را در تراشه M5 تعبیه کرده که به طور خاص وظیفه انجام عملیات ضرب ماتریس را به عهده دارند. طبق نمودارهای منتشرشده توسط اپل، نتایج زیر برای مدلهای مختلف هوش مصنوعی ثبت شده است:
- مدل Qwen 14B: زمان پردازش از ۳۵.۱۵ ثانیه در M4 به ۸.۶۶ ثانیه در M5 کاهش یافته است (۴.۱ برابر سریعتر).
- مدل Qwen 8B: بهبود از ۱۸.۶ ثانیه به ۴.۶۹ ثانیه (۴ برابر سریعتر).
- مدل سنگین Qwen 30B: بهبود از ۹.۳۷ ثانیه به ۲.۶۶ ثانیه (۳.۵ برابر سریعتر).
این بدین معناست که تأخیر آزاردهندهای که در حین کار با مدلهای محلی روی لپتاپ احساس میکردید، به طرز چشمگیری کاهش یافته است.
افزایش سرعت پردازش هوش مصنوعی در تراشه M5 اپل
برعکس مرحله اول (TTFT)، فرآیند تولید کلمات بعدی (تکمیل پاسخ) به توانایی حافظه لپتاپ وابسته است. در این بخش، اهمیت سرعت پردازنده به مراتب کاهش مییابد و این مسئله بستگی به این دارد که اطلاعات چقدر سریع میتوانند از حافظه رم به پردازنده منتقل شوند.
تراشه M5 با پهنای باند حافظه ۱۵۳ گیگابایتبرثانیه مجهز شده است که نسبت به ۱۲۰ گیگابایتبرثانیه در M4، بهبود تقریباً ۲۸ درصدی را به همراه دارد. به همین دلیل، سرعت تولید متن نیز در بنچمارکها به میزان ۱.۱۹ تا ۱.۲۷ برابر (حدود ۱۹ تا ۲۷ درصد) تقویت شده است.
جدول زیر، جزئیات خاص تستهای انجامشده بر روی مکبوک پرو با ۲۴ گیگابایت رم را به نمایش میگذارد:
| مدل هوش مصنوعی | بهبود سرعت شروع (TTFT) | بهبود سرعت تولید متن | مصرف حافظه (GB) |
| Qwen3-1.7B | ۳.۵۷ برابر | ۱.۲۷ برابر | ۴.۴۰ |
| Qwen3-8B | ۳.۶۲ برابر | ۱.۲۴ برابر | ۱۷.۴۶ |
| Qwen3-8B | ۳.۹۷ برابر | ۱.۲۴ برابر | ۵.۶۱ |
| Qwen3-14B | ۴.۰۶ برابر | ۱.۱۹ برابر | ۹.۱۶ |
| GPT-OSS 20B | ۳.۳۳ برابر | ۱.۲۴ برابر | ۱۲.۰۸ |
| Qwen3-30B (MoE) | ۳.۵۲ برابر | ۱.۲۵ برابر | ۱۷.۳۱ |
جالب است بدانید که مکبوک پرو با ۲۴ گیگابایت رم موفق به اجرای مدل سنگین 30 میلیارد پارامتری شده و تنها ۱۷.۳۱ گیگابایت از حافظه را مصرف کرده است؛ در حالیکه همچنان فضای کافی برای سیستمعامل فراهم است.




