تحلیل چگونگی آسیب رسیدن به پردازندههای نسل 13 و 14 اینتل
ماهها پس از بحث بر سر مشکلات پیش آمده و خرابی پردازندههای سری K نسل 13 و 14 اینتل، به نظر می رسد، کمکم خورشید از پشت ابر بیرون آمده و مشکلی که این پردازندهها بدان دچار هستند، عیان شده است. در این مقاله تلاش میکنیم به توضیح چگونگی بروز مشکل در پردازنده های نسل 13 و 14 اینتل بپردازیم.
صورت مسئله: چرا پردازندههای نسل 13 و 14 اینتل Degrade میکنند؟
سالهاست که پردازندههای اینتل از حالت بوست اتوماتیک بهرهمند هستند. بدین صورت که هستههای پردازنده یک فرکانس کاری پایه دارند. برای مثال فرکانس کاری پایه هستههای P در پردازنده 14900K، برابر 3.2 گیگاهرتز است.
این پردازنده به هنگام پردازش، به صورت اتوماتیک فرکانس تمام هستههای خود را بوست کرده و به 5.6 گیگاهرتز میرساند. پس از مدتی فعالیت در این فرکانس، در صورتی که از نظر حرارتی ظرفیت پردازنده لبریز شود، تمام هستهها به فرکانس پایینتر، مثلا 4.8 گیگاهرتز عقب گرد میکنند.
در صورتی که ظرفیت حرارتی پردازنده پر نشده باشد، (دمای پردازنده مناسب باشد) فن آوری دیگری به نام Intel Turbo Max Technology 3 وارد عمل شده و فرکانس هستههایی را که دمای مناسبی دارند، تا 200 مگاهرتز دیگر افزایش میدهند تا سرعت پردازنده به فرکانس 5.8 گیگاهرتز افزایش یابد.
حال اگر، همچنان از نظر حرارتی، ظرفیت تحمل پردازنده اجازه دهد، فن آوری دیگری به نام Thermal Velocity Boost وارد عمل شده، و به انتخاب خود، 2 هسته خنک تر را – نسبت به دیگر هستههای پردازنده انتخاب میکند تا 200 مگاهرتز دیگر آن دو هسته را افزایش فرکانس دهد. بدین ترتیب پردازنده 14900K به فرکانس 6 گیگاهرتز دست مییابد. این الگورتیم، بزرگترین نقطه قوت فن آوری اینتل است.
در هر مرحله از افزایش فرکانس، اگر دمای پردازنده مناسب باشد، فرکانس در حالت بوست همچنان به ادامه فعالیت میپردازد تا به سقف فرکانس پردازنده برسد. همچنین در هر مرحله از افزایش فرکانس، در صورتی که ظرفیت حرارتی پردازنده پر شود، سقف فرکانس هستههای پردازنده افت پیدا کرده و به میزان قابل توجهی کاهش مییابد. بدین ترتیب فرکانس به درجات کمتر عقب نشینی می کند. سپس مجددا با خنک شدن پردازنده، دوباره فرکانس پله پله اوج میگیرد.
این الگوریتم افزایش فرکانس، برگ برنده اینتل در گیمینگ است. چراکه عموما بازیها، با تعداد هستههای کمی پردازش میشوند و چنین مکانیسمی از افزایش پلکانی فرکانس، در ظرف زمانی محدود میتواند، وقتی که بازی در یک صحنه به پردازش سنگین نیاز دارد، به داد کاربر برسد تا میزان خروجی FPS بازی همواره در اوج و عالی ترین سطح خود باقی بماند.
تا اینجای کار مشکلی نیست، اما باید بدانید، هرچه فرکانس افزایش مییابد، هستههای پردازنده به همان نسبت افزایش فرکانس، به ولتاژ ورودی بیشتری نیاز پیدا میکنند. که در نتیجه آن، پردازنده از مادربرد درخواست ولتاژ بالاتری میکند. در اینجا رگلاتوری تغذیه مادربرد، باتوجه به درخواست پردازنده، ولتاژ ورودی را باب میل پردازنده تنظیم میکند.
بنابراین به طور خلاصه میتوان گفت، مکانیسم افزایش فرکانس پلهای، که شرکت اینتل برای پردازندههای رپتور لیک Raptor Lake نسل 13 و 14 در نظر گرفته است، با افزایش مصرف برق و افزایش ولتاژ ورودی هستهها همراه است.
تا اینجای کار را داشته باشید، تا مطلب دیگری را در مورد خود پردازنده توضیح دهیم.
وضعیت رفتار سیلیکن در قبال افزایش ولتاژ
افزایش ولتاژ به هر دلیلی که صورت پذیرد، همواره سبب افزایش حرارت پردازنده میشود و ولتاژ زیاد و خارج از حد تحمل پردازنده، قاتل سیلیکن پردازنده است. اگر به پردازنده برای مدت طولانی بیش از توان تحمل آن ولتآژ زیادی برسد، کیفیت سیلیکن پردازنده به مرور تنزل پیدا کرده و Degrade میکند، و این بدین معناست که آن پردازنده دیگر نمیتواند، با ولتاژ عادی، در حالت عادی، در فرکانس استاندارد خود کار کند.
یک پردازنده Degrade کرده، هم از نظر کارایی افت میکند و هم از نظر حرارتی به دلیل افزایش ولتاژ کاری، داغتر کار میکند و ظرفیت پردازشی آن محدودتر میشود.
گاهی میزان تنزل کیفیت بقدری زیاد است که باعث بروز خطای فنی BSOD یا صفحه آبی مرگ میشود.
حالا باز میگردیم به پردازندههای نسل 13 و 14 اینتل:
شرکت اینتل چند بخش از پردازندههای نسل 13 و 14 را نسبت به نسل 12 تقویت کرده است. حجم حافظه کش افزایش یافته، تعداد هستهها افزایش یافته، فرکانس هستهها افزایش یافته، و همچنین مصرف پردازنده به سبب این تغییرات بالا رفته است.
شرکت اینتل، به سبب تغییرات فوق، مجبور بوده است، دامنه ولتاژ بیشتری را برای تغذیه نسل 13 و 14 تعریف کند، چراکه نسبت به پردازندههای نسل 12، بسیار گشنه تر هستند. برای این موضوع، اینتل هستههای P پردازنده را به خوبی تقویت کرده، تا بتوانند، تحمل ولتاژ بالایی را داشته باشند.
تا اینجای کار مشکلی نیست. اما، به نظر میرسد، حداقل تا بدین لحظه که این مقاله نوشته میشود، اکثر متخصصین سخت افزار مشکوک هستند به بخشی از پردازنده به نام CPU RING که تغذیه آن از ریل مشترک V-Core یا ولتاژ اصلی ورودی هسته های پردازنده صورت می گیرد. این بخش به نظر میرسد، آنچنان که باید و شاید، به اندازه هستههای P، تقویت نشده است.
نقش CPU RING چیست؟
بخش CPU RING نیز مانند دیگر بخشهای پردازنده از جنس سیلیکون ساخته شده است و قسمتی از پردازنده است که اتصال دهنده هستهها به حافظه کش، و همچنین مموری کنترلر RAM سیستم است. نقش CPU RING در حقیقت مثل یک هاب Input و Output است که دادهها را از حافظه رم از طریق کنترلر مموری دریافت میکند و سپس به حافظه کش و از آنجا به هستهها، و پس از پردازش، دادهها را از هستهها خارج و در مسیری برعکس، از پردازنده خارج میکند.
این بخش از پردازنده که به آنهاب I/O نیز گفته میشود، فرکانس کاری مستقل مخصوص به خود را دارد که ضریب آن به نام Uncore Ratio یا Ring Ratio در بایوس مادربرد مشهور است. فرکانس RING در پردازندههای نسل 12 حدود 3.8 گیگاهرتز بود.
در حال حاضر ظن آن میرود که شرکت اینتل بخش RING پردازندههای نسل 12 را، بدون تقویت کردن، و بدون تست درازمدت، صرفا با افزایش فرکانس کاری آن تا 4.8 گیگاهرتز، در نسل 13 و 14 استفاده کرده است.
در پردازندههای نسل 12، به دلیل ولتاژ کاری کمتر و همچنین تعداد هستههای کمتر، پردازنده به ولتاژ کاری کمتری نیاز دارد، در نتیجه، بخش RING که ریل برق مشترک با ریل V-Core تغذیه هستهها دارد، ولتاژ معقولی را دریافت میکند و سالم میماند.
اما بخش RING در نسل 13 و 14، به دلیل تراکم بالاتر هستهها و تقاضای بیشتر ولتاژ از طرف هستهها، اصطلاحا Overvolt میشود و ولتاژ بیشتر از حد تحمل خود را دریافت میکند و همین موضوع به مرور سبب از بین رفتن و فرو پاشی این بخش سیلیکونی پردازنده میشود.
چه میزان ولتاژی باعث تخریب CPU RING میشود؟
تحمل ولتاژهای بیش از 1.4 ولت در ریل V-Core برای بخش RING پردازندههای نسل 13 و 14 بسیار دشوار است و به نظر میرسد، زمانی که ولتاژ به محدود 1.5 ولت میرسد و حتی از آن فراتر میرود، روند تنزل کیفیت سیلیکن یا به اصطلاح Degrade شدن به سرعت آغاز میشود.
متاسفانه اکثر پردازندههای Core i9 اینتل، به دلیل فرکانس کاری بالا، به ولتاژ V-Core بیش از 1.45 ولت برای عملکرد طبیعی خود نیاز دارند و همین مسئله، معضل بزرگ این پردازندهها و مسبب تخریب RING آنهاست.
بنابراین تمام پردازندههای Core i9 در صورت تداوم این وضعیت به مرور – دیر یا زود خراب خواهند شد – و معدود پردازندههای Core i9 که خراب نمیشوند، 2 حالت دارند: یا کیفیت نسبی سیلیکون آنها بالاتر است، که این دسته از پردازندهها کمتر از 20 درصد مجموع تولیدات را تشکیل میدهند.
در حالت دوم، یک عامل ثالث، مثل کاربر یا مادربر، یا نوع کاربری سیستم، مانع از افزایش ولتاژ به سطوح خطرناک شده و بدین ترتیب پردازنده سالم میماند.
در مورد پردازندههای Core i7، این گروه از پردازندهها اگر ولتاژ مناسبی در رنج 1.3 تا 1.4 دریافت کنند، از خرابی بخش RING مصون خواهند ماند.
پردازندههای Core i5 نیز اگر ولتاژ مناسبی در رنج 1.2 تا 1.3 ولت دریافت کنند، از خرابی بخش RING مصون خواهند ماند. متاسفانه دیده شده است که در بسیاری موارد، در اثر اشتباه مادربرد و یا تنظیمات غلط، ولتاژ V-Core فراتر از 1.4 ولت به این پردازندهها تزریق میشود که در نتیجه آن، پردازندههای Core i5 و Core i7 و به طور کلی هر پردازنده نسل 13 و 14 نیز Degrade میکند.
چرا خرابی پردازندههای نسل 13 و 14 آثار و علائم متنوعی دارد؟
تصویر فوق یک تصویر فرضی و کاملا مفهومی است. اینکه چرا علائم آسیب به پردازنده و Degrade شدن آن متنوع است، به این واقعیت بازمیگردد که حلقه هاب ورودی و خروجی پردازنده، بخشهای مختلفی را به یکدیکر متصل میکند. بسته به اینکه کدام بخش از RING دچار تنزل کیفیت شود و Degrade کند، علائم خرابی پردازنده متفاوت است.
برای مثال، اگر سمتی از RING متلاشی شود که در نزدیکی هستههای E قرار دارد، شما میتوانید با غیر فعال کردن هستههای E، مجدد از پردازنده استفاده کنید. به همین دلیل است که در برخی از گزارشها، کاربران توانسته اند با Disable کردن هستههای E، مجدد از پردازنده استفاده کنند.
مثال دیگر، اگر سمتی از RING متلاشی شود که در نزدیکی کنترلر مموری یا IMC قرار داشته باشد، نتیجه آن عدم توانایی بوت شدن سیستم با رمهای فرکانس بالاست. به گونه ای که در برخی موارد کاربر مجبور شده است رمهای DDR5 را با فرکانس 3600 مگاهرتز اجرا کند، تا سیستم بوت شود.
همچنین اگر RING بقدر زیادی آسیب ببیند که دیگر نتواند مثل سابق، فرکانس کاری خود را حفظ کند، هستههای P دیگر نمیتوانند در فرکانس کاری بالا مثلا 6 گیگاهرتز پایدار بمانند و بخش RING با آسیبی که دیده است، پایداری هستههای P را نیز به زیر خود میکشد. در اینگونه از آسیبها کاربران با کاهش فرکانس هستههای P به زیر 5 گیگاهرتز توانسته اند، پردازنده آسیب دیده را پایدار کنند.
با توجه به موارد فوق، آیا میتوان فقط با آندرولت کردن، پردازنده را از آسیب احتمالی نجات داد؟
پاسخ به این سوال دشوار است، اما، به نظر میرسد آندرولت کردن تا حد زیادی جلوی آسیب دیدن RING را میگیرد. کاربران میتوانند با اعمال تنظیمات آندرولت، هرچه بیشتر از ولتاژ V-Core کم کنند تا درسطح مناسبی قرارگیرد، و در عین حال سیستم پایدار بماند.
اینتل چه چیزی را قرار است با ارائه مایکروکد جدید اصلاح کند؟
به این تصویر نگاه کنید، این تست چند هسته ای Cinebench R23 است، که در آن تمام هستهها پردازش رندرینگ را به پایان برده اند، و حداکثر ولتاژ V-Core برابر 1.371 ولت ثبت شده است. این بدان معناست، سقف ولتاژ ورودی به RING کمتر از 1.4 ولت است و در محدوده امن قرار دارد.
حداکثر دمای ثبت شده 79 درجه و حداکثر توان پردازنده برای انجام این تست، 230 وات بوده است. من آیتمهای مهم PL1/2 و ICCMax این سیستم را مطابق با این مقاله تغییر داده و همچنین آن را آندرولت کردم و این تست پس از آندرولت انجام شده، به این دلیل رنج ولتاژ V-Core در حد استاندارد است.
حال به این تصویر نگاه کنید، این تست رندر تک هسته ایه نرم افزار Cinebench است که فقط با استفاده از یک هسته، به انجام رندر پرداخته. میزان مصرف پردازنده فقط 98 وات بوده، و دمای آن فقط 64 سانتیگراد، که هر دوی این موارد، از تست چند هسته ای، کمتر هستند. ما از میان تمام هستهها، فقط یک هسته را استفاده کردیم، اما در کمال تعجب، ولتاژ ورودی V-Core برابر 1.41 ولت ثبت شد، که بسیار بیشتر از حالتی است که تمام هستهها درگیر رندر بوده اند.
مشکلی که اینتل بایستی حل کند، دقیقا همینجاست. اینکه چرا درحالتی که پردازنده خنک تر بود، فقط نصف میزان واتیج خود را مصرف میکرده است، و تنها یک هسته آن مشغول به کار بوده، ریل V-Core ولتاژ بالاتری را به تک هسته پردازنده تزریق کرده، که در نتیجه آن ولتاژ بالاتری به بخش RING پردازنده روانه شده است.
بازمیگردیم به ابتدای مقاله. گفتیم الگوریتم اینتل برمبنای ظرفیت حرارتی است، و پردازنده را به گونهای طراحی کرده است که در صورتی که حرارت مناسبی داشته باشد، بتواند به درجات بالاتری از فرکانس دست یابد و در آن حالت باقی بماند.
وقتی پردازنده از چند هسته استفاده کند، به سرعت ظرفیت حرارتی آن پر شده و در نتیجه آن، پردازنده به مانند بازی قایم موشک فقط دست خود را به دیوار فرکانس 6 گیگاهرتز میزند و به سرعت عقبگرد کرده، به فرکانسهای پایینتری تنزل میکند، درنتیجه ولتاژ ورودی کمتری را تقاضا میکند.
اما وقتی پردازنده تنها یک یا دو هسته خود را استفاده میکند، به هیچ وجه ظرفیت حرارتی آن اشباع نمیشود. دمای آن همواره مطلوب میماند، و علیرغم مصرف واتیج بسیار پایین، این شرایط سبب میشود، یک یا دو هسته، دائما در حداکثر فرکانس کاری، مثلا 6 گیگاهرتز باقی بمانند، و این هستهها، در کمال تعجب ولتاژ بسیار بالاتری را، تقاضا می کنند، و مادربرد خاضعانه هر آنچه آنها از ولتاژ طلب کنند، در سبد اخلاص تقدیم میکند.
این همان معضلی است که باعث میشود، پردازندههای Core i9 به کار رفته در سرورهای بازی، به سرعت Degrade کنند و خراب شوند. سرورهای بازی Minecraft فقط یک هسته را استفاده میکنند و گفته میشود پردازندههای 14900K فقط 2 هفته بر روی سرورهای Minecraft دوام میآورند.
این موضوع همچنین نشان میدهد چرا گیمینگ بیش از هر کار دیگری، قاتل پردازندههای نسل 13 و 14 است. به علت آنکه بار پردازشی اغلب بازیها بر روی یک یا دو هسته سوار میشود، و همان دو هسته، با طلب کردن ولتاژ بالاتر، باعث تخریب بخش RING میشوند.
اینجاست که نقطه قوت الگوریتم بوست پله ای فرکانس اینتل، به همان نقطه ضعف پردازنده های نسل 13 و 14 تبدیل می شود.
این مشکلی است که با آندرولت میشود تا حد زیادی درجه آسیب آن را کم کرد، اما همانطور که در تست فوق بر روی سیستم مشاهده کردید، به طور کامل حل نمیشود و باید اینتل با ارائه آپدیت در میکروکد پردازنده و تغییر الگوریتم خود، آن را حل کند. و یا اینکه، از طریق ایجاد محدودیت ولتاژ در حالت بوست دو هسته، مانع از بوقوع پیوستن سناریوی افزایش ولتاژ V-Core به بیش از حد مجاز شود.