کامپیوتر و سخت افزار

تحلیل چگونگی آسیب رسیدن به پردازنده‌های نسل 13 و 14 اینتل


ماه‌ها پس از بحث بر سر مشکلات پیش آمده و خرابی پردازنده‌های سری K نسل 13 و 14 اینتل، به نظر می رسد، کم‌کم خورشید از پشت ابر بیرون آمده و مشکلی که این پردازنده‌ها بدان دچار هستند، عیان شده است. در این مقاله تلاش می‌کنیم به توضیح چگونگی بروز مشکل در پردازنده های نسل 13 و 14 اینتل بپردازیم.

صورت مسئله: چرا پردازنده‌های نسل 13 و 14 اینتل Degrade می‌کنند؟

سالهاست که پردازنده‌های اینتل از حالت بوست اتوماتیک بهره‌مند هستند. بدین صورت که هسته‌های پردازنده یک فرکانس کاری پایه دارند. برای مثال فرکانس کاری پایه هسته‌های P در پردازنده 14900K، برابر 3.2 گیگاهرتز است.

این پردازنده به هنگام پردازش، به صورت اتوماتیک فرکانس تمام هسته‌های خود را بوست کرده و به 5.6 گیگاهرتز می‌رساند. پس از مدتی فعالیت در این فرکانس، در صورتی که از نظر حرارتی ظرفیت پردازنده لبریز شود، تمام هسته‌ها به فرکانس پایینتر، مثلا 4.8 گیگاهرتز عقب گرد می‌کنند.

در صورتی که ظرفیت حرارتی پردازنده پر نشده باشد، (دمای پردازنده مناسب باشد) فن آوری دیگری به نام Intel Turbo Max Technology 3 وارد عمل شده و فرکانس هسته‌هایی را که دمای مناسبی دارند، تا 200 مگاهرتز دیگر افزایش می‌دهند تا سرعت پردازنده به فرکانس 5.8 گیگاهرتز افزایش یابد.

حال اگر، همچنان از نظر حرارتی، ظرفیت تحمل پردازنده اجازه دهد، فن آوری دیگری به نام Thermal Velocity Boost وارد عمل شده، و به انتخاب خود، 2 هسته خنک تر را – نسبت به دیگر هسته‌های پردازنده انتخاب می‌کند تا 200 مگاهرتز دیگر آن دو هسته را افزایش فرکانس دهد. بدین ترتیب پردازنده 14900K به فرکانس 6 گیگاهرتز دست می‌یابد. این الگورتیم، بزرگترین نقطه قوت فن آوری اینتل است.

در هر مرحله از افزایش فرکانس، اگر دمای پردازنده مناسب باشد، فرکانس در حالت بوست همچنان به ادامه فعالیت می‌پردازد تا به سقف فرکانس پردازنده برسد. همچنین در هر مرحله از افزایش فرکانس، در صورتی که ظرفیت حرارتی پردازنده پر شود، سقف فرکانس هسته‌های پردازنده افت پیدا کرده و به میزان قابل توجهی کاهش می‌یابد. بدین ترتیب فرکانس به درجات کمتر عقب نشینی می کند. سپس مجددا با خنک شدن پردازنده، دوباره فرکانس پله پله اوج می‌گیرد.

این الگوریتم افزایش فرکانس، برگ برنده اینتل در گیمینگ است. چراکه عموما بازی‌ها، با تعداد هسته‌های کمی‌ پردازش می‌شوند و چنین مکانیسمی‌ از افزایش پلکانی فرکانس، در ظرف زمانی محدود می‌تواند، وقتی که بازی در یک صحنه به پردازش سنگین نیاز دارد، به داد کاربر برسد تا میزان خروجی FPS بازی همواره در اوج و عالی ترین سطح خود باقی بماند.

تا اینجای کار مشکلی نیست، اما باید بدانید، هرچه فرکانس افزایش می‌یابد، هسته‌های پردازنده به همان نسبت افزایش فرکانس، به ولتاژ ورودی بیشتری نیاز پیدا می‌کنند. که در نتیجه آن، پردازنده از مادربرد درخواست ولتاژ بالاتری می‌کند. در اینجا رگلاتوری تغذیه مادربرد، باتوجه به درخواست پردازنده، ولتاژ ورودی را باب میل پردازنده تنظیم می‌کند.

بنابراین به طور خلاصه می‌توان گفت، مکانیسم افزایش فرکانس پله‌ای، که شرکت اینتل برای پردازنده‌های رپتور لیک Raptor Lake نسل 13 و 14 در نظر گرفته است، با افزایش مصرف برق و افزایش ولتاژ ورودی هسته‌ها همراه است.

تا اینجای کار را داشته باشید، تا مطلب دیگری را در مورد خود پردازنده توضیح دهیم.

وضعیت رفتار سیلیکن در قبال افزایش ولتاژ

افزایش ولتاژ به هر دلیلی که صورت پذیرد، همواره سبب افزایش حرارت پردازنده می‌شود و ولتاژ زیاد و خارج از حد تحمل پردازنده، قاتل سیلیکن پردازنده است. اگر به پردازنده برای مدت طولانی بیش از توان تحمل آن ولتآژ زیادی برسد، کیفیت سیلیکن پردازنده به مرور تنزل پیدا کرده و Degrade می‌کند، و این بدین معناست که آن پردازنده دیگر نمی‌تواند، با ولتاژ عادی، در حالت عادی، در فرکانس استاندارد خود کار کند.

یک پردازنده Degrade کرده، هم از نظر کارایی افت می‌کند و هم از نظر حرارتی به دلیل افزایش ولتاژ کاری، داغتر کار می‌کند و ظرفیت پردازشی آن محدودتر می‌شود.

گاهی میزان تنزل کیفیت بقدری زیاد است که باعث بروز خطای فنی BSOD یا صفحه آبی مرگ می‌شود.

حالا باز میگردیم به پردازنده‌های نسل 13 و 14 اینتل:

شرکت اینتل چند بخش از پردازنده‌های نسل 13 و 14 را نسبت به نسل 12 تقویت کرده است. حجم حافظه کش افزایش یافته، تعداد هسته‌ها افزایش یافته، فرکانس هسته‌ها افزایش یافته، و همچنین مصرف پردازنده به سبب این تغییرات بالا رفته است.

شرکت اینتل، به سبب تغییرات فوق، مجبور بوده است، دامنه ولتاژ بیشتری را برای تغذیه نسل 13 و 14 تعریف کند، چراکه نسبت به پردازنده‌های نسل 12، بسیار گشنه تر هستند. برای این موضوع، اینتل هسته‌های P پردازنده را به خوبی تقویت کرده، تا بتوانند، تحمل ولتاژ بالایی را داشته باشند.

تا اینجای کار مشکلی نیست. اما، به نظر می‌رسد، حداقل تا بدین لحظه که این مقاله نوشته می‌شود، اکثر متخصصین سخت افزار مشکوک هستند به بخشی از پردازنده به نام CPU RING که تغذیه آن از ریل مشترک V-Core یا ولتاژ اصلی ورودی هسته های پردازنده صورت می گیرد. این بخش به نظر می‌رسد، آنچنان که باید و شاید، به اندازه هسته‌های P، تقویت نشده است.

نقش CPU RING چیست؟

بخش CPU RING نیز مانند دیگر بخش‌های پردازنده از جنس سیلیکون ساخته شده است و قسمتی از پردازنده است که اتصال دهنده هسته‌ها به حافظه کش، و همچنین مموری کنترلر RAM سیستم است. نقش CPU RING در حقیقت مثل یک‌ هاب Input و Output است که داده‌ها را از حافظه رم از طریق کنترلر مموری دریافت می‌کند و سپس به حافظه کش و از آنجا به هسته‌ها، و پس از پردازش، داده‌ها را از هسته‌ها خارج و در مسیری برعکس، از پردازنده خارج می‌کند.

این بخش از پردازنده که به آن‌هاب I/O نیز گفته می‌شود، فرکانس کاری مستقل مخصوص به خود را دارد که ضریب آن به نام Uncore Ratio یا Ring Ratio در بایوس مادربرد مشهور است. فرکانس RING در پردازنده‌های نسل 12 حدود 3.8 گیگاهرتز بود.

در حال حاضر ظن آن می‌رود که شرکت اینتل بخش RING پردازنده‌های نسل 12 را، بدون تقویت کردن، و بدون تست درازمدت، صرفا با افزایش فرکانس کاری آن تا 4.8 گیگاهرتز، در نسل 13 و 14 استفاده کرده است.

در پردازنده‌های نسل 12، به دلیل ولتاژ کاری کمتر و همچنین تعداد هسته‌های کمتر، پردازنده به ولتاژ کاری کمتری نیاز دارد، در نتیجه، بخش RING که ریل برق مشترک با ریل V-Core تغذیه هسته‌ها دارد، ولتاژ معقولی را دریافت می‌کند و سالم می‌ماند.

اما بخش RING در نسل 13 و 14، به دلیل تراکم بالاتر هسته‌ها و تقاضای بیشتر ولتاژ از طرف هسته‌ها، اصطلاحا Overvolt می‌شود و ولتاژ بیشتر از حد تحمل خود را دریافت می‌کند و همین موضوع به مرور سبب از بین رفتن و فرو پاشی این بخش سیلیکونی پردازنده می‌شود.

چه میزان ولتاژی باعث تخریب CPU RING می‌شود؟

تحمل ولتاژهای بیش از 1.4 ولت در ریل V-Core برای بخش RING پردازنده‌های نسل 13 و 14 بسیار دشوار است و به نظر می‌رسد، زمانی که ولتاژ به محدود 1.5 ولت می‌رسد و حتی از آن فراتر می‌رود، روند تنزل کیفیت سیلیکن یا به اصطلاح Degrade شدن به سرعت آغاز می‌شود.

متاسفانه اکثر پردازنده‌های Core i9 اینتل، به دلیل فرکانس کاری بالا، به ولتاژ V-Core بیش از 1.45 ولت برای عملکرد طبیعی خود نیاز دارند و همین مسئله، معضل بزرگ این پردازنده‌ها و مسبب تخریب RING آنهاست.

بنابراین تمام پردازنده‌های Core i9 در صورت تداوم این وضعیت به مرور – دیر یا زود خراب خواهند شد – و معدود پردازنده‌های Core i9 که خراب نمی‌شوند، 2 حالت دارند: یا کیفیت نسبی سیلیکون آنها بالاتر است، که این دسته از پردازنده‌ها کمتر از 20 درصد مجموع تولیدات را تشکیل می‌دهند.

در حالت دوم، یک عامل ثالث، مثل کاربر یا مادربر، یا نوع کاربری سیستم، مانع از افزایش ولتاژ به سطوح خطرناک شده و بدین ترتیب پردازنده سالم می‌ماند.

در مورد پردازنده‌های Core i7، این گروه از پردازنده‌ها اگر ولتاژ مناسبی در رنج 1.3 تا 1.4 دریافت کنند، از خرابی بخش RING مصون خواهند ماند.

پردازنده‌های Core i5 نیز اگر ولتاژ مناسبی در رنج 1.2 تا 1.3 ولت دریافت کنند، از خرابی بخش RING مصون خواهند ماند. متاسفانه دیده شده است که در بسیاری موارد، در اثر اشتباه مادربرد و یا تنظیمات غلط، ولتاژ V-Core فراتر از 1.4 ولت به این پردازنده‌ها تزریق می‌شود که در نتیجه آن، پردازنده‌های Core i5 و Core i7 و به طور کلی هر پردازنده نسل 13 و 14 نیز Degrade می‌کند.

چرا خرابی پردازنده‌های نسل 13 و 14 آثار و علائم متنوعی دارد؟

تصویر فوق یک تصویر فرضی و کاملا مفهومی ‌است. اینکه چرا علائم آسیب به پردازنده و Degrade شدن آن متنوع است، به این واقعیت بازمیگردد که حلقه هاب ورودی و خروجی پردازنده، بخش‌های مختلفی را به یکدیکر متصل می‌کند. بسته به اینکه کدام بخش از RING دچار تنزل کیفیت شود و Degrade کند، علائم خرابی پردازنده متفاوت است.

برای مثال، اگر سمتی از RING متلاشی شود که در نزدیکی هسته‌های E قرار دارد، شما می‌توانید با غیر فعال کردن هسته‌های E، مجدد از پردازنده استفاده کنید. به همین دلیل است که در برخی از گزارش‌ها، کاربران توانسته اند با Disable کردن هسته‌های E، مجدد از پردازنده استفاده کنند.

مثال دیگر، اگر سمتی از RING متلاشی شود که در نزدیکی کنترلر مموری یا IMC قرار داشته باشد، نتیجه آن عدم توانایی بوت شدن سیستم با رمهای فرکانس بالاست. به گونه ای که در برخی موارد کاربر مجبور شده است رمهای DDR5 را با فرکانس 3600 مگاهرتز اجرا کند، تا سیستم بوت شود.

همچنین اگر RING بقدر زیادی آسیب ببیند که دیگر نتواند مثل سابق، فرکانس کاری خود را حفظ کند، هسته‌های P دیگر نمی‌توانند در فرکانس کاری بالا مثلا 6 گیگاهرتز پایدار بمانند و بخش RING با آسیبی که دیده است، پایداری هسته‌های P را نیز به زیر خود می‌کشد. در اینگونه از آسیب‌ها کاربران با کاهش فرکانس هسته‌های P به زیر 5 گیگاهرتز توانسته اند، پردازنده آسیب دیده را پایدار کنند.

با توجه به موارد فوق، آیا می‌توان فقط با آندرولت کردن، پردازنده را از آسیب احتمالی نجات داد؟

پاسخ به این سوال دشوار است، اما، به نظر میرسد آندرولت کردن تا حد زیادی جلوی آسیب دیدن RING را می‌گیرد. کاربران می‌توانند با اعمال تنظیمات آندرولت، هرچه بیشتر از ولتاژ V-Core کم کنند تا درسطح مناسبی قرارگیرد، و در عین حال سیستم پایدار بماند.

اینتل چه چیزی را قرار است با ارائه مایکروکد جدید اصلاح کند؟

به این تصویر نگاه کنید، این تست چند هسته ای Cinebench R23 است، که در آن تمام هسته‌ها پردازش رندرینگ را به پایان برده اند، و حداکثر ولتاژ V-Core برابر 1.371 ولت ثبت شده است. این بدان معناست، سقف ولتاژ ورودی به RING کمتر از 1.4 ولت است و در محدوده امن قرار دارد.

حداکثر دمای ثبت شده 79 درجه و حداکثر توان پردازنده برای انجام این تست، 230 وات بوده است. من آیتمهای مهم PL1/2 و ICCMax این سیستم را مطابق با این مقاله تغییر داده و همچنین آن را آندرولت کردم و این تست پس از آندرولت انجام شده، به این دلیل رنج ولتاژ V-Core در حد استاندارد است.

حال به این تصویر نگاه کنید، این تست رندر تک هسته ایه نرم افزار Cinebench است که فقط با استفاده از یک هسته، به انجام رندر پرداخته. میزان مصرف پردازنده فقط 98 وات بوده، و دمای آن فقط 64 سانتیگراد، که هر دوی این موارد، از تست چند هسته ای، کمتر هستند. ما از میان تمام هسته‌ها، فقط یک هسته را استفاده کردیم، اما در کمال تعجب، ولتاژ ورودی V-Core برابر 1.41 ولت ثبت شد، که بسیار بیشتر از حالتی است که تمام هسته‌ها درگیر رندر بوده اند.

مشکلی که اینتل بایستی حل کند، دقیقا همینجاست. اینکه چرا درحالتی که پردازنده خنک تر بود، فقط نصف میزان واتیج خود را مصرف می‌کرده است، و تنها یک هسته آن مشغول به کار بوده، ریل V-Core ولتاژ بالاتری را به تک هسته پردازنده تزریق کرده، که در نتیجه آن ولتاژ بالاتری به بخش RING پردازنده روانه شده است.

بازمی‌گردیم به ابتدای مقاله. گفتیم الگوریتم اینتل برمبنای ظرفیت حرارتی است، و پردازنده را به گونه‌‍ای طراحی کرده است که در صورتی که حرارت مناسبی داشته باشد، بتواند به درجات بالاتری از فرکانس دست یابد و در آن حالت باقی بماند.

وقتی پردازنده از چند هسته استفاده کند، به سرعت ظرفیت حرارتی آن پر شده و در نتیجه آن، پردازنده به مانند بازی قایم موشک فقط دست خود را به دیوار فرکانس 6 گیگاهرتز می‌زند و به سرعت عقبگرد کرده، به فرکانس‌های پایینتری تنزل می‌کند، درنتیجه ولتاژ ورودی کمتری را تقاضا می‌کند.

اما وقتی پردازنده تنها یک یا دو هسته خود را استفاده می‌کند، به هیچ وجه ظرفیت حرارتی آن اشباع نمیشود. دمای آن همواره مطلوب می‌ماند، و علیرغم مصرف واتیج بسیار پایین، این شرایط سبب می‌شود، یک یا دو هسته، دائما در حداکثر فرکانس کاری، مثلا 6 گیگاهرتز باقی بمانند، و این هسته‌ها، در کمال تعجب ولتاژ بسیار بالاتری را، تقاضا می کنند، و مادربرد خاضعانه هر آنچه آنها از ولتاژ طلب کنند، در سبد اخلاص تقدیم می‌کند.

این همان معضلی است که باعث می‌شود، پردازنده‌های Core i9 به کار رفته در سرور‌های بازی، به سرعت Degrade کنند و خراب شوند. سرور‌های بازی Minecraft فقط یک هسته را استفاده می‌کنند و گفته می‌شود پردازنده‌های 14900K فقط 2 هفته بر روی سرور‌های Minecraft دوام می‌آورند.

این موضوع همچنین نشان می‌دهد چرا گیمینگ بیش از هر کار دیگری، قاتل پردازنده‌های نسل 13 و 14 است. به علت آنکه بار پردازشی اغلب بازی‌ها بر روی یک یا دو هسته سوار می‌شود، و همان دو هسته، با طلب کردن ولتاژ بالاتر، باعث تخریب بخش RING می‌شوند.

اینجاست که نقطه قوت الگوریتم بوست پله ای فرکانس اینتل، به همان نقطه ضعف پردازنده های نسل 13 و 14 تبدیل می شود.

این مشکلی است که با آندرولت می‌شود تا حد زیادی درجه آسیب آن را کم کرد، اما همانطور که در تست فوق بر روی سیستم مشاهده کردید، به طور کامل حل نمی‌شود و باید اینتل با ارائه آپدیت در میکروکد پردازنده و تغییر الگوریتم خود، آن را حل کند. و یا اینکه، از طریق ایجاد محدودیت ولتاژ در حالت بوست دو هسته، مانع از بوقوع پیوستن سناریوی افزایش ولتاژ V-Core به بیش از حد مجاز شود.

مقالات مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا