کامپیوتر و سخت افزار

پشتیبانی از تولید فریم برای کارت‌ گرافیک های RTX 30: انویدیا درب را بسته نگذاشت


در جریان نمایشگاه CES 2025، دیجیتال فاندری با برایان کاتانزارو، معاون تحقیقات یادگیری عمیق کاربردی انویدیا، مصاحبه‌ای انجام داد و در مورد معرفی DLSS 4 و ویژگی‌های جدید آن در زمینه‌های Super Resolution ،Ray Reconstruction و Frame Generation بحث کرد. پشتیبانی از تولید فریم برای کارت‌ گرافیک های RTX 30 یکی از استراتژی‌های جدید انویدیا برای سال 2025 است که اتفاقات خوبی رقم خواهد زد.

کاتانزارو در مورد مدل‌های جدید ترنسفورمر که جایگزین شبکه‌های عصبی کانولوشنی (CNN) برای Super Resolution و Ray Reconstruction شده‌اند، توضیح داد. این مدل‌ها به مراتب هوشمندتر از گذشته هستند، قادر به آموزش روی داده‌های بزرگتری هستند و به همین دلیل تصمیمات بهتری اتخاذ می‌کنند که به رفع مشکلات پیشین DLSS، مانند لرزش یا شبح‌زنی، کمک می‌کند. به طور خاص، مدل جدید Super Resolution نسبت به نسخه قبلی چهار برابر قدرت محاسباتی بیشتری دارد. هرچند کاتانزارو زمان اضافی رندر را تخمین نزد، اما تأکید کرد که انویدیا معتقد است این روش، بهترین تجربه بازی را روی کارت‌های گرافیک جدید GeForce RTX 50 با معماری Blackwell که به زودی وارد بازار می‌شوند، ارائه خواهد داد.

پشتیبانی از تولید فریم (Frame Generation) در حال بازسازی است و مدل قبلی که بر اساس شتاب‌دهنده سخت‌افزاری Optical Flow بود، جای خود را به یک راه‌حل کاملاً مبتنی بر هوش مصنوعی داده است. در این‌جا دلیل این تغییر توضیح داده شده است:

زمانی که NVIDIA DLSS 3 Frame Generation را طراحی کردیم، برای محاسبه Optical Flow به شتاب‌دهی سخت‌افزاری نیاز داشتیم. چون نه تعداد کافی Tensor Core داشتیم و نه الگوریتم Optical Flow مناسبی در دسترس بود. ما هیچ الگوریتم Optical Flow واقعی‌زمانی که روی Tensor Core ها اجرا شود و متناسب با بودجه محاسباتی ما باشد، نداشتیم. در عوض، شتاب‌دهنده Optical Flow را داشتیم که انویدیا آن را برای سال‌ها به عنوان تکامل فناوری کدک ویدیویی خود توسعه داده بود و همین‌طور در شتاب‌دهنده‌های بینایی ماشین برای خودروهای خودران استفاده می‌شد.

برایان کاتانزارو

او ادامه داد: استفاده از این شتاب‌دهنده در DLSS 3 Frame Generation منطقی بود، اما مشکل پیاده‌سازی هر الگوریتم سخت‌افزاری مانند Optical Flow این است که به سختی می‌توان آن را بهبود داد. به نوعی، محدودیت‌های آن مشخص است و شکست‌هایی که از شتاب‌دهنده Optical Flow به‌وجود آمد، با یک شبکه عصبی هوشمندتر قابل اصلاح نبود. تا این‌که تصمیم گرفتیم آن را کنار بگذاریم و به راه‌حلی کاملاً مبتنی بر هوش مصنوعی روی بیاوریم. این‌چنین بود که تولید فریم در DLSS 4 را به طور کامل بر اساس هوش مصنوعی ساختیم.

تولید فریم برای کارت‌ گرافیک های RTX 30

بروزرسانی‌های جدید انویدیا برای سری RTX 30

مدل جدید تولید فریم حالا بیشتر به Tensor Core ها وابسته است، اما از VRAM کمتری استفاده می‌کند، کیفیت تصویر بهتری ارائه می‌دهد (که کاتانزارو آن را برای Multi Frame Generation جدید در کارت‌های گرافیک RTX 50 بسیار حیاتی می‌داند) و همچنین از نظر کارایی بهبود یافته است، زیرا هزینه محاسباتی آن بین چندین فریم تقسیم شده است.

آلکس باتالیای دیجیتال فاندری از برایان کاتانزارو پرسید که آیا مدل جدید DLSS می‌تواند به سخت‌افزارهای قدیمی‌تر مانند کارت‌های گرافیک GeForce RTX 30 منتقل شود یا خیر، و کاتانزارو در پاسخ در این باره درب را بسته نگذاشت.

او گفت: «این بیشتر یک مسئله بهینه‌سازی و مهندسی است و در نهایت به تجربه کاربری بستگی دارد. ما این فناوری تولید فریم را، که بهترین تکنولوژی Multi Frame Generation است، با سری 50 معرفی می‌کنیم و باید ببینیم که در آینده چه چیزهایی از سخت‌افزارهای قدیمی‌تر می‌توان استخراج کرد.»

یادآوری می‌شود که وقتی انویدیا فناوری تولید فریم را با کارت‌های گرافیک GeForce RTX 40 معرفی کرد، کاتانزارو اشاره کرده بود که این ویژگی اختصاصی کارت‌های گرافیک جدید است، چرا که آن‌ها شتاب‌دهنده سخت‌افزاری Optical Flow بهبودیافته‌تری نسبت به سری RTX 30 داشتند. در آن زمان، او همچنین گفته بود که به‌طور تئوری این قابلیت می‌تواند به سخت‌افزارهای قدیمی‌تر منتقل شود، ولی احتمالاً به اندازه کارت‌های جدید کارآمد نخواهد بود.

اما با توجه به حذف شتاب‌دهنده سخت‌افزاری Optical Flow در مدل جدید، به نظر می‌رسد که انتقال این فناوری به سخت‌افزارهای قدیمی‌تر ممکن است. با این حال، کاتانزارو تاکید کرد که نیازمندی‌های بیشتر برای Tensor Core ها وجود دارد و معماری قدیمی‌تر GPU ها عملکرد ضعیف‌تری در این زمینه دارند. بنابراین باید دید که آیا انویدیا می‌تواند این ویژگی را به‌طور واقعی روی سخت‌افزارهای قدیمی‌تر پیاده‌سازی کند یا خیر.

در ادامه مصاحبه، کاتانزارو به اهمیت جداکردن به‌روزرسانی متریس فلیپ از پردازنده مرکزی (CPU) اشاره کرد تا زمان تغییر فریم‌ها کاهش یابد و بهبود چشم‌گیری در پایایی فریم‌ها (frame pacing) ایجاد کند. او گفت که این تغییر موجب بهبود پنج تا ده برابری در ثبات فریم‌ها نسبت به گذشته می‌شود. همچنین، او افزود که بازی با Reflex 2 (که آن‌هم مبتنی بر هوش مصنوعی است) حس “اتصال” بیشتری ایجاد می‌کند و به اعتقاد او گیمرهای حساس به تأخیر، از این ویژگی بسیار استقبال خواهند کرد.

مطالب مرتبط:

امتیاز: 5.0 از 5 (1 رای)