کامپیوتر و سخت افزار

سکوت مرگبار اینتل در برابر دلیل خرابی پردازنده‌ Core i9 نسل 13 و 14


مقدمه: در ادامه سری مقالات مرتبط با مشکلات مطرح شده در مورد پردازنده‌های Core i9 اینتل، مقاله اول، دوم، سوم، در سکوت خبری مرگبار اینتل و تداوم خرابی‌ها، علیرغم آپدیت‌های بایوس و تغییراتی که توسط اینتل پیشنهاد شده بود، ظرف روزهای گذشته بعضی از کانالهای فن آوری یوتیوب به موارد جدید و عجیبی برخورد کردند که تمام علائم، حکایت از وجود یک مشکل اساسی در طراحی پردازنده‌های Core i9 نسل 13 و 14 اینتل دارد.

به دلیل آنکه شرکت اینتل پس از گذشت چند ماه هنوز هیچ توضیح واضحی برای خرابی احتمالی این پردازنده‌ها ارائه نکرده و هیچ گونه توجیهی در ارتباط با این موضوع نداشته است، امروز در این مطلب به بیان احتمالات مطرح شده توسط منابع مختلف پیرامون دلیل خرابی این پردازنده‌ها می‌پردازیم.

سکانس اول: عودت تعداد زیادی از پردازنده‌های Core i9 به گارانتی اینتل در کره جنوبی

اولین اخبار جدی مبنی بر خرابی حجم زیادی از پردازنده‌های Core i9 نسل 13 و 14 از کره جنوبی درز کرد. کره جنوبی یکی از پیشرفته ترین کشورهای دنیاست و وجود مردمان ثروتمند، به معنای وجود تعداد زیادی گیمر و استریمر است. گیمرهای حرفه‌ای زیادی در کره جنوبی از پردازنده‌های Core i9 اینتل برای بازی و استریمینگ استفاده می‌کنند و در کمال تعجب، این کاربران روزانه با بیش از ده‌ها مورد خرابی به گارانتی اینتل مراجعه کردند.

در ابتدا اینتل از پذیرش وجود مشکل سر باز می‌زند اما به مرور که خبرهای بیشتری در مورد RMA پردازنده‌های Core i9 منتشر می‌شود، اینتل در فروم سایت خود، یک تاپیک مخصوص برای گزارش خرابی باز می‌کند تا کاربرانی که به مشکل برخورد کردند، گزارش خرابی و تجربه خود را در آنجا عنوان کنند.

کافی است به بخش پردازنده‌های فروم اینتل مراجعه کنید، تعداد زیادی گزارش مبنی بر بروز ناپایداری و خرابی پردازنده‌های i9 مشاهده خواهید کرد.

سکانس دوم: مقصر دانستن سازندگان مادربرد در طراحی پروفایل تغذیه پردازنده

یک ماه بعد از گزارش خرابی‌ها، شرکت اینتل با پذیرش وجود مشکل، سازندگان مادربرد را متهم به تخطی از استانداردهای تعیین شده توسط اینتل کرد.

در همین راستا شرکت‌های Asus، MSI، و Gigabyte متهم شدند که با خاموش کردن تعمدی برخی مکانیسم‌های محافظتی اینتل مانند CEP در مادربردهای Z790/Z690، و بازکردن شیر فلکه آمپراژ و واتیج PL1/2، باعث بروز بی ثباتی، و در نهایت Degrade کردن پردازنده‌های Core i9 شدند.

این اولین باری بود که بحث Degrade کردن پردازنده‌ها مطرح شد. اما Degrade کردن پردازنده چیست؟ پردازنده از شن ساخته می‌شود. شن‌های ساحل دریا منابع عظیم سیلیکون درون خود دارند. شن برای تبدیل شدن به پردازنده مراحل پروسسینگ طولانی را طی می‌کند که به آن به اختصار، ریخته‌گری می‌گویند.

سیلیکون نیمه‌هادی است و به ولتاژ بسیار حساس است. برای ساخت پردازنده، میلیاردها ترانزیستور درون سیلیکن ساخته می‌شود. این ترانزیستورها در برابر ولتاژ آستانه تحمل محدودی دارند. اگر ولتاژ در یک بازه محدود و دامنه مشخص به پردازنده برسد، پردازنده بدون مشکل کار می‌کند تا اینکه سالها، گاهی ده یا 20 سال طول بکشد تا کیفیت سیلیکون درون پردازنده، به دلیل استهلاک، تنزل پیدا کند، که در نتیجه آن پردازنده برای کار کردن به ولتاژ بیشتری نیاز پیدا کند، که در نتیجه رسیدن ولتاژ بیشتر، مراحل تنزل کیفیت سیلیکون تسریع شوند تا بالاخره عمر پردازنده به پایان برسد.

این سیر طبیعی عمر یک پردازنده، که ممکن است، ده‌ها سال به طول انجامد. این سیر طبیعی به دست اورکلاکرها بر هم خورد. اورکلاکرها با خنک کردن مصنوعی پردازنده و دادن ولتاژی بالاتر از آستانه تحمل آن، برای ثبت رکورد فرکانس، بعضا باعث خرابی یا Degrade کردن پردازنده می‌شدند.

چرا که همه‌ی پردازنده‌ها کیفیت ساخت یکسانی ندارند و فقط بعضی از آنها، که کیفیت سیلیکون بالاتری داشته باشند، آستانه تحمل ولتاژ بیشتری دارند. پردازنده‌هایی که کیفیت سیلیکون آنها پایینتر است، با دادن ولتاژ زیاد، در مدت کوتاهی سیلیکون آنها تنزل می‌یابد و عمرشان به پایان می‌رسد. وقتی یک پردازنده چنین بلایی سرش می‌آید، به اصطلاح می گویند، پردازنده Degrade کرده است و دیگر توانایی سابق را ندارد.

شرکت اینتل، با بررسی و مطالعه پردازنده‌های آسیب دیده Core i9 نسل 13 و 14، آثار Degrade کردن سیلیکون را مشاهده کرده بود.

 سکانس سوم: مجبور کردن سازندگان مادربرد به اصلاح پروفایل تغذیه

شرکت اینتل با ارائه دستور العمل جدیدی به سازندگان مادربرد، از تمام آنها خواست تا بدون معطلی بایوس‌های جدیدی بسازند که در آن، پروفایل دیفالت اینتل، به عنوان پروفایل پیش فرض سیستم فعال شود. بدین ترتیب وقتی سیستم روشن می‌شود، تنظیمات پیش فرض اینتل فعال باشد که در آن سقف مقادیر ولتاژ و آمپراژ ورودی به پردازنده محدود نگهداشته شوند.

شرکت‌های سازنده مادربرد نیز به تبعیت از دستور اینتل، بایوس جدیدی ساختند و تنظیمات اینتل را به صورت پیش فرض فعال کردند. این درحالی بود که اگر کاربری دلش می‌خواست تنظیمات قبلی مادربرد را اعمال کند باید وارد بایوس می‌شد و پروفایل را عوض می‌کرد.

در این فاصله، شرکت اینتل متوجه وجود یک باگ در مایکروکد 0x123 خودش شد که عملکرد eTVB را دچار اخلال می‌کرد و پردازنده‌های Core i9 علیرغم داشتن حرارت بالا، همچنان در فرکانس بالا باقی می‌ماندند. شرکت اینتل با صدور مایکروکد جدید 0x125، مجددا از شرکتهای سازنده مادربرد درخواست کرد، یک بایوس اصلاحی دیگر را برای مادربردهای خود منتشر کنند تا مایکروکد جدید 0x125 در سیستم کاربران فعال شود.

نسخه جدید بایوس مجهز به میکروکد 0x125 دیروز منتشر شد.

اگرچه تمام این اتفاقات ظرف چهار ماه گذشته رخ داده است و میزان خرابی پردازنده‌های نسل 13 و 14، پس از تغییرات بایوس، کاهش یافته، اما، قطع نشده است.

سکانس چهارم: گزارش خرابی سرورهای بازی توسط کانال Level1Techs

چند روز پیش، کانال فن آوری Level1Techs گزارش مفصلی از خرابی سرورهای مخصوص بازی که به پردازنده‌های Core i9 نسل 13 و 14 مجهز بودند ارائه کرد. سرور‌های بازی مخصوص بازی‌های آنلاین هستند که کاربران در بازی‌هایی که بخش آنلاین دارند، درون این سرورها بازی می‌کنند.

سرورهای مخصوص بازی از مادربردهای Asus و Supermicro مجهز به چیپست W680 استفاده می‌کنند. این چیپست به مانند چیپست‌های B و H فاقد امکان اورکلاک پردازنده است، و از مدار تغذیه ساده ای برخوردار است.

این نوع مادربردها مشخصا منطبق بر دستورات اینتل برای حداکثر پایداری ساخته شده و اصولا مشکلی که در سکانس دوم این مقاله به آن پرداختیم، برای آنها وجود نداشته است!

اما امار خرابی که کانال Level1Techs ارائه کرد، وحشتناک بود. نیمی ‌از پردازنده‌های Core i9 نسل 13 و 14 مورد استفاده سرورها، Degrade می‌کردند. مشخصا نیمی ‌از پردازنده‌های 13900K(F/S) و 14900K(F/S) به گارانتی عودت داده می‌شدند. آمار آنقدر بالا بود که اغلب شرکتهای ارائه کننده خدمات سروری، نرخ هزینه نگهداری سرورهای مجهز به این پردازنده‌ها را تا 10 برابر گرانتر از هزینه نگهداری سرورهای مجهز به پردازنده‌های AMD بالا برده بودند.

این کانال هیچ توضیح قطعی در رابطه با دلیل احتمالی خرابی پردازنده‌ها ارائه نمی‌کند اما، شواهد و علائمی ‌را بیان می‌کند که نشان از وجود یک مشکل اساسی در طراحی این پردازنده‌ها است.

پردازنده‌های Core i9 اینتل، در اغلب موارد به وقت انجام Oodle Data Decompression عنان از کف می‌دهند و سیستم BSOD می‌دهد. انجام این عملیات غیر فشرده سازی دیتا که از سال 2020 به موتور بازی سازی آنریل اینجین Unreal Engine اضافه شد است، برای دسته کم نیمی ‌از پردازنده‌های Core i9 اینتل نسل 13 و 14 نا ممکن است.

تنها ساعاتی پس از انتشار ویدیوی Level1Techs، شرکت بازی سازی Alderon Games با انتشار گزارشی از خرابی 100% تمام پردازنده‌های Core i9 نسل 13 و 14 اینتل خبر داد و ادعا کرد، شرکت اینتل پردازنده‌های خراب به مردم می‌فروشد. این شرکت با اعلام اینکه تمام سیستم‌هایی که از این پردازنده‌ها استفاده می‌کردند، دچار ناپایداری می‌شدند، اضافه کرد این شرکت بازی ساز مجبور شده است، از پلتفرم AMD بجای اینتل برای بازی سازی استفاده کند.

ساعاتی پس از این گزارش، توسعه دهندگان بازی Warframe نیز گزارش مبسوطی از آمار کرش کردن سیستم‌های کاربران ارائه کردند. در این گزارش، توسعه دهندگان تاکید داشتند، پردازنده‌های نسل 13 و 14 اینتل، نه به خاطر کدهای آنها، بلکه به خاطر مشکلی که با فایل nvgpucomp64.dll درایور انویدیا دارند، کرش می‌کنند!

این فایل، بخش مهمی ‌از درایور کارت گرافیک انویدیا است، که به نظر می‌رسد، وقتی دیتای خراب از طرف پردازنده به سمت کارت گرافیک حواله می‌شود، دچار مشکل شده و سیستم کرش می‌کند. شرکت انویدیا قبلا نیز به خاطر پیام خطای کافی نبودن حافظه مموری کارت گرافیک، که کاربران به خاطر داشتن پردازنده‌های نسل 13 و 14 با آن مواجه می‌شدند، گفته بود به شرکت اینتل باید مراجعه کرد. به نظر می‌رسد حداقل انویدیا، همان زمان هم متوجه جدی بودن داستان شده بوده است.

آماری که Warframe منتشر کرد، حاوی نکات خیلی مهمی ‌است. اول اینکه آمار خرابی 13900K بیشتر از 14900K است، نشان میدهد چون 13900K یک سال زودتر وارد بازار شده، بنابراین طبیعی است آمار خرابی بالاتری نسبت به 14900K داشته باشد.

نکته بعدی، وجود خرابی در پردازنده‌های Core i7 سری K است که بسیار بسیار کمتر در گزارش خرابی حضور دارند. تفاوت بین i7 و i9 در تعداد هسته‌ها و فرکانس هسته‌ها است، و این بدان معناست که مشکل هرچه که هست، با افزایش فرکانس و تعداد هسته‌ها، مشکل بیشتر خود را بروز می‌دهد.

این موضوع همچنین در گزارش Level1Techs بیان شده بود که در برخی موارد، پردازنده‌های Core i9، با کاهش فرکانس هسته‌ها و یا با غیر فعال کردن هسته‌های E، توانسته بودند پردازنده‌های Core i9 را پایدار کنند.

و نکته مهم دیگر، عدم حضور پردازنده‌های Core i5 در این چارت است. بنابراین، کاربرانی که Core i5 و یا پردازنده‌های رده پایینتر نسل 13 و 14 دارند، مشکلی ندارند.

سکانس پنجم: احتمال خرابی CPU RING ‌هاب اتصال دهنده

پس از موفقیت نسل 12، شرکت اینتل در طراحی نسل 13 که به نام رمز Raptor Lake مشهور است، چهار تغییر عمده داد. اولین تغییر افزایش فرکانس هسته‌ها بود. تغییر مهم دیگر، که بخش بالا رده این پردازنده‌ها را شامل می‌شد، افزایش تعداد هسته‌ها بود.

شرکت اینتل با افزایش تعداد هسته‌ها، ظرفیت کش پردازنده را نیز افزایش داد. کش حافظه‌ای است درون پردازنده که به نوعی میز کار پردازنده است که هرچه ظرفیت آن بیشتر شود، سرعت عملیاتی پردازنده بیشتر میشود.

شرکت اینتل همچنین با ارتقای مموری کنترلر IMC، که وظیفه هندل کردن رم را عهده دار است، در نسل 13 توانست از فرکانس‌های بالای 7000 مگاهرتز پشتیبانی کند.

این چهار تغییر (افزایش فرکانس، افزایش تعداد هسته، افزایش ظرفیت کش، و ارتقای مموری کنترلر) نسل 13 را بوجود آوردند. نسل 14 که به نام Raptor Lake Refresh مشهور است، همین موارد را بهینه تر و ارتقا یافته تر ارائه می‌کند.

روز گذشته، کانال فن آوری Actually Hardcore Overclocking، نظریه‌ای را مطرح کرد، که احتمالا می‌تواند دلیل آسیب رسیدن به پردازنده‌های Core i9 را توضیح دهد. بلیدزوید در این ویدیو بیان می‌کند که چرا حدس می‌زند که بخش هاب اتصال دهنده بین هسته‌ها، کش، و کنترلر پردازنده، که به CPU RING معروف است، در پردازنده‌های Core i9، به مرور تخریب شده، و Degrade می شود.

اما CPU RING چیست؟ این حلقه اتصال دهنده این سه بخش حیاتی از پردازنده است: یعنی هسته‌های پردازنده را به حافظه کش و به کنترلر مموری درون پردازنده متصل می‌کند. وظیفه این حلقه انتقال سریع اطلاعات بین اجزای پردازنده است و فرکانس کاری آن به نام Ring Ratio و یا Uncore Cache Ratio درون بایوس معروف است.

اگرچه CPU RING فرکانس کاری مستقلی دارد، اما ولتاژ ورودی آن با ولتاژ ورودی هسته‌ها یا همان V-Core، یکی است.

شرکت اینتل در نسل 13 و 14، همزمان با افزایش فرکانس کاری هسته‌ها و تعداد آنها، مجبور بوده است تا ولتاژ ورودی را نیز افزایش دهد، و این موضوع باعث افزایش ولتاژ ورودی CPU Ring شده است. به نظر میرسد، این بخش از پردازنده در Core i9ها، توانایی تحمل ولتاژی که به هسته‌ها میرسد را ندارد و به مرور تخریب می‌شود.

پردازنده‌های Core i9 که تعداد هسته‌های بیشتری دارند، و فرکانس کاری بالاتری را پشتیبانی می‌کنند ولتاژ بیشتری را طلب می‌کنند. همچنین اگر کیفیت سیلیکون پردازنده پایین باشد، بازهم ولتاژ بیشتری را به نسبت همنوعان خود طلب می‌کند. احتمالا به همین خاطر است، که 50 درصد پردازنده‌های Core i9 اینتل خراب می‌شوند چون کیفیت سیلیکن متوسط رو به پایین تری دارند و حلقه CPU RING در آنها زودتر Degrade می‌کند و پردازنده‌ها دچار خطا میشوند.

این موضوع همچنین نشان می‌دهد، آن 50 درصد دیگر از پردازنده‌های Core i9 که کیفیت سیلیکون بالاتری دارند، به ولتاژ کمتری نیاز دارند در نتیجه، سالم می‌مانند.

این موضوع همچنین دلیل خرابی کمتر پردازنده‌های Core i7 را توجیه می‌کند. چون I7‌ها فرکانس کمتر و هسته‌های کمتری دارند، پس کمتر دچار خرابی CPU RING می‌شوند. آن پردازنده‌های Core i7 نیز که دچار مشکل شدند، احتمالا کیفیت سیلیکون پایینی داشتند و ولتاژ بیشتری را طلب کردند و به این خاطر CPU RING در آنها آسیب دیده است.

این موضوع همچنین نشان می‌دهد چرا Core i5‌ها دچار مشکل نشده اند، چراکه به نسبت i7 و i9، پردازنده‌های i5 به ولتاژ کاری کمتری نیاز دارند و از نظر تعداد هسته‌ها، پردازنده‌های i5 نسل 13 و 14 با پردازنده‌های i7 نسل 12 یکی هستند.

این شواهد نشان میدهد که چرا اینتل تا به امروز سکوت اختیار کرده است، و صرفا از کاربران میخواهد به گارانتی مراجعه کنند و پردازنده را عوض کنند. چراکه با تغییر پردازنده شرکت اینتل امیدوار است بالاخره یکی از پردازنده‌های تعویضی کیفیت سیلیکن مناسب تری داشته باشد تا مشکل کاربر رفع شود.

بر اساس شواهد و قرائن، تخریب CPU RING که ناشی از ولتاژ کاری بالای هسته‌های Core i9 است، به دلیل Degrade شدن سیلیکون درون آن اتفاق می‌افتد، و هیچ راهی برای اصلاح آن وجود ندارد، مگر آنکه اینتل با کاهش فرکانس کاری پردازنده، بین 500 الی 700 مگاهرتز، ولتاژ کاری پردازنده را کاهش دهد. چنین کاری عملا، پردازنده Core i9 را از جایگاه رفیع Performance خود به زیر خواهد کشید.

سخن پایانی

هنوز اینتل هیچ توضیح رسمی ارائه نکرده است و حدس‌های یوتیوبرها و کاربران فنی، مادامی‌ که توسط اینتل تایید نشود، صرفا تئوری هستند. اما چیزی که تا به امروز مشخص شده است، این است که آپدیت بایوس، آندرولت، کاهش آمپراژ ورودی، کاهش سقف واتیج PL1/PL2، و تمام اصلاحاتی که در مقالات گذشته به آن پرداختیم، تمام آن کارها واجب است چراکه کمک خواهند کرد تا Degrade کردن پردازنده و تنزل کیفیت سیلیکون CPU RING به تعویق بیفتد.

اما احتمالا درمان قطعی نخواهد بود و اگر پردازنده شما کیفیت سیلیکون مناسبی نداشته باشد، به نظر می‌رسد هیچ راهی نیست که بتوان در آینده جلوی تخریب آن را گرفت. اگر تغییرات پیشنهاد شده را انجام ندهید، احتمالا Degrade کردن پردازنده i9 زیر یک سال رخ خواهد داد.

برای ما که در ایران هستیم، اگر پردازنده Core i9 نسل 13 و یا 14 دارید، توصیه اکید دارم که حتما تغییراتی را که در مقاله سوم به آن پرداختیم، انجام دهید تا بتوانید دوام پردازنده را تا جای ممکن افزایش دهید. به یاد داشته باشید، نیمی ‌از پردازنده‌های Core i9 اینتل بدون مشکل کار می‌کنند و شاید شما هم یکی از دارندگان خوش شانس Core i9 باشید که می‌تواند تا سالهای سال از پردازنده خود استفاده کند.

در ایران خوشبختانه هنوز هیچ گزارشی مبنی بر بروز خرابی Core i9 بابت Degrade شدن پردازنده مشاهده نشده است. این موضوع دلایل زیادی میتواند داشته باشد. یکی از آن دلایل می‌تواند کیفیت نسبی خوب پردازنده‌های وارداتی باشد که تا به امروز وارد کشور شده است. اما آینده نامعلوم است.

توصیه می‌کنیم اگر قصد خرید سیستم جدید دارید، سراغ Core i9 ضریب باز سری K مانند (13900K(F)/13900KS/14900K(F)/14900KS) نروید. برای سیستم جدید یا Core i7 بخرید و یا از Ryzen 9 7950X استفاده کنید.

تاکید مجدد می کنیم، پردازنده های ضریب بسته i3/i5/i7/i9، و همچنین پردازنده های Core i5 ضریب باز سری K نسل 13 و 14، هیچ گونه مشکلی تاکنون نداشته و ندارند.

مقالات مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا