معماری GPU جدید NVIDIA مملو از فناوری های جدید باورنکردنی است و خیابان هایی جلوتر از Ampere است.
NVIDIA شناخته شده است که هر دو سال یک معماری نسل جدید کارت گرافیک را منتشر می کند. در سال 2018، تراشه تورینگ را برای پردازندههای گرافیکی GTX سری 16 و RTX 20 منتشر کرد. سپس در سال 2020 تراشه های Ampere را برای پردازنده گرافیکی RTX 3000 معرفی کرد.
و همانطور که انتظار می رفت، در طول کنفرانس فناوری پردازنده گرافیکی NVIDIA در سپتامبر 2022، جنسن هوانگ، مدیرعامل انویدیا، سرانجام ریزمعماری Ada Lovelace را معرفی کرد که نسل سوم پردازنده های گرافیکی RTX را تامین می کند.
بنابراین، ریزمعماری Ada Lovelace چه پیشرفت هایی را برای پردازنده گرافیکی RTX 4000 به ارمغان می آورد؟
1. یک گره فرآیند کاملاً جدید
ریزمعماری Ada Lovelace مبتنی بر فناوری 4 نانومتری N4 TSMC است که آن را به نصف تراشه نسل قبلی Ampere بر اساس فرآیند 8 نانومتری سامسونگ کوچک میکند. این نانومتر کوچکتر که با بهبود فرآیند گره به دست میآید، به سری RTX 4000 اجازه میدهد تا توان بیشتری را به صورت کارآمد ارائه کنند.
این بدان معناست که حتی نسخههای میانردهای که NVIDIA در آینده عرضه خواهد کرد، میتوانند با تراشههای سری 30 برتر مانند 3090 Ti رقابت کنند.
2. تنظیم مجدد اجرای سایه بان
به دلیل ساختار موازی خود، یک GPU در استفاده از چندین هسته از پردازنده های خود برای انجام یک کار عالی است. با این حال، ردیابی پرتو با رندر صحنه ها کاملاً متفاوت است. این به این دلیل است که پرتوهای نور به همه جا تابیده می شوند و برای هر سطحی که برخورد می کند و هر جهتی که می رود به محاسبات متفاوتی نیاز دارد. این بدان معناست که پردازندههای گرافیکی در هنگام پردازش شیدرهای مختلف کارایی کمتری دارند.
اما با اجرای مجدد Shader Execution (SER)، تراشه Lovelace میتواند بار کاری خود را تغییر دهد و اطمینان حاصل کند که سایهزنهای مشابه با هم پردازش میشوند. این به چند پردازنده های جریانی اجازه می دهد تا کارآمدتر کار کنند، زیرا آنها به طور همزمان روی داده های مشابه کار می کنند.
3. DLSS 3.0
RTX یک کار نیازمند منابع است، به خصوص اگر با رزولوشن های بالاتر مانند 4K و بالاتر کار می کنید. به همین دلیل NVIDIA DLSS (Deep Learning Super Sampling) را توسعه داد. فناوری DLSS از هوش مصنوعی برای پیشبینی پیکسل بعدی استفاده میکند و به کاهش بار کاری بر روی GPU کمک میکند.
اما با معماری Ada Lovelace DLSS 3.0، NVIDIA پیش بینی را از پیکسل به فریم گسترش می دهد. این به GPU اجازه می دهد تا فریم بعدی را پیش بینی کند، حتی بدون نگاه کردن به داده های تصویری که هنوز رندر نشده اند. انجام این کار باعث بهبود عملکرد هر دو بازیهای GPU و CPU سنگین میشود، که Huang ادعا میکند تا چهار برابر بهتر از رندرهای brute-force هستند.
4. هسته های تانسور
انویدیا در تلاش است تا در فضای محاسباتی هوش مصنوعی بزرگ شود و این در آخرین نسل تراشه خود نشان داده شده است. ریزمعماری Ada Lovelace از هستههای Tensor نسل چهارم استفاده میکند که قادر به ارائه 1400 TFLOP تانسور است که چهار برابر سریعتر از 3090 Ti است که فقط 320 TFLOP تانسور داشت.
این نسل جدید Tensor Cores احتمالاً به همین دلیل است که DLSS 3.0 بسیار بهتر از تکرارهای قبلی خود عمل می کند. همچنین میتواند دلیل عملکرد تراشههای سری 4000 با مدل نسبتاً پایینتر از مدلهای سطح بالای پردازندههای گرافیکی سری 3000 باشد.
5. بهبود قدرت و بهره وری
انویدیا ادعا میکند که تراشههای Ada برای بازیهای شطرنجی دو برابر سریعتر و برای بازیهای ردیابی پرتو تا چهار برابر سریعتر هستند. علاوه بر این، آنها می گویند که آخرین تراشه های آن بیش از دو برابر عملکرد یکسانی را ارائه می دهند.
و به دلیل این پیشرفتها، میتوانید پردازندههای گرافیکی Lovelace را بیش از ۳ گیگاهرتز اورکلاک کنید – اما این به قیمت مصرف انرژی عظیم است: حداکثر ۴۵۰ وات برای RTX 4090.
با این وجود، این پیشرفتها همچنین میتواند دلیلی باشد که شایعه شده RTX 4070 به اندازه RTX 3090 Ti قدرتمند است و RTX 4090 دو برابر قدرت 3090 Ti را در همان مصرف برق ارائه میکند.
قلب پردازنده های گرافیکی سری RTX 4000
ریزمعماری Ada Lovelace یک جهش دیگر در قدرت، عملکرد و کارایی GPU از NVIDIA است. و از آنجایی که این تراشه قلب تپنده پردازندههای گرافیکی مصرفی سری RTX 4000 است، انتظار داریم این کارتهای ورودی عملکرد فوقالعادهای را ارائه دهند.
با این حال، اینها فقط ادعاهای تئوری هستند تا زمانی که در 12 اکتبر 2022 به RTX 4090 و ماه بعد به RTX 4080 دست پیدا کنیم. بنابراین، ما نفس خود را حبس کرده ایم و منتظریم تا زمانی که واحدهای خرده فروشی وارد قفسه فروشگاه ها می شوند، معیارهای واقعی را ببینیم.