در این مطلب به بررسی پیشرفت­های معماری RDNA در کارت گرافیک
Navi (پردازنده گرافیکی) پرداخته‌ایم.
از مدرن­ترین کارت‌های گرافیک AMD مبتنی بر این معماری یعنی
RX 5700 XT و RX 5700 بیشتر خواهیم گفت.

کمپانی AMD  در مراسم Next Horizon که در جریان E3 در سال جاری برگزار شد.
کنفرانس جامعی درباره کارت گرافیک  Navi با معماری جدید RDNA ارائه داد.
این پردازنده‌ی گرافیکی قرار است در دو مدل کارت گرافیک
Radeon RX 5700 XT و Radeon RX 5700 وارد بازار شود.‏
کمپانیAMD  قصد دارد این دو کارت گرافیک را به میدان رقابت با
کارت‌های تورینگ RTX 2070 و RTX 2060 انویدیا بفرستد.

کمپانیAMD  در سری اول پردازنده‌های گرافیکی  Navi (Navi 10 )
از تکنولوژی Ray Tracing مبتنی بر سخت‌افزار استفاده نخواهد کرد.

دیوید وانگ به عنوان رئیس بخش تکنولوژی رادئون (RTG)،
بر این باور است که در حال حاضر محاسبات Ray Tracing
در فضای cloud  به بهترین شکل انجام‌پذیر است.

می‌توان نتایج محاسبات را به خروجی نمایشگرها ارسال کرد.
با این وجود ممکن است AMD پردازنده‌های گرافیکی Navi 20
را در سال ۲۰۲۱ با این قابلیت به بازار عرضه کند.

پردازنده گرافیکی Navi که قدرت پردازش کارت‌ گرافیک سری RX 5700 را تأمین می‌کند.
با تکنولوژی ساخت ۷ نانومتری شرکت تایوانی TSMC تولید شده.
همینطور قابلیت پشتیبانی از استاندارد ارتباطی PCIe 4.0 را دارد.
به این ترتیب کارت‌ گرافیک سری RX 5700 شرکت AMD اولین سری کارت‌های گرافیکی خواهد بود،
که روی اسلات توسعه‌ی نسل چهارم PCIe از تمامی ظرفیت پهنای باند آن به خوبی پشتیبانی خواهد کرد.
پردازنده‌ی گرافیکی Navi با بهره‌مندی از موتورهای Radeon Media و Radeon Display
پاسخگوی تمامی نیازهای گرافیست­ها و تولیدکنندگان محتوا خواهد بود.
تجربه نوینی از تکنولوژی‌های جدید صفحه مانیتور را به کاربر خواهد داد.

پردازنده‌های کارت گرافیک Navi اگرچه در ابتدا از معماری GCN استفاده نموده­ اند.
اما به کمک معماری جدید RDNA بهینه و متحول شده­اند.

به عبارت دیگر در حال حاضر Navi را می‌توان محصول دو معماری GCN و RDNA دانست.

درواقع GCN همچنان راه حل بسیار مناسبی برای اجرای وظایف محاسباتی سنگین است.
وظایفی که در آن توان عملیاتی بالا و توازی کاری نقشی کلیدی ایفا می‌کند.
پردازنده‌ی گرافیکی Vega 64 با ویژگی­های منحصربه فرد خود
قصد غلبه بر کارت گرافیک Geforce GTX 1080 بود، اما موفق نبود.
علت ناکامی این کارت گرافیک در غلبه بر محصول پرچم‌دار رقیب

این بود که تراشه‌ی  Vega با استفاده از معماری GCN در بکارگیری هسته‌ها
و حافظه‌ی کش خود آنچنان موفق نبود.
از طرف دیگر پردازنده‌های گرافیکی Navi در بکار بردن
این دو حوزه بهتر عملکرد بهتر عمل می­کند.
زیرا AMD معتقد است این تراشه­ های گرافیکی یا کارت­ گرافیک

کارت گرافیگ

۴۰ واحد محاسباتی کارت گرافیگ Navi

با ترکیب کارآمدتری از واحدهای محاسباتی ارائه خواهد شد.
با این ترکیب، سلسله مراتب حافظه‌ی کش و پایپ‌لاین‌های گرافیکی جدیدی ارائه خواهد شد.
که در ادامه به بررسی آن­ها خواهیم پرداخت.

در قدم اول نگاهی به ساختار بلوک‌بندی پردازنده‌ی گرافیکی Navi 10 خواهیم داشت.
این پردازنده‌ی گرافیکی در کارت گرافیک RX 5700 XT و در کارت گرافیک RX 5700 به‌کار رفته است.
البته کارت گرافیک RX 5700 XT دارای توان عملیاتی بیشتری نسبت به دیگری است.

پردازنده‌ی گرافیکی Navi 10  ۴۰ واحد محاسباتی دارد.
که هر واحد ۶۴ پردازنده‌ دارد و در مجموع ۲۵۶۰ هسته‌ی محاسباتی در این پردازنده فعال هستند.
باوجود اینکه تعداد این هسته‌ها در مقایسه با تراشه­ ها‌ی گرافیکی کارت‌ گرافیک های Vega 64 و Vega 56 کاهش یافته است.
اما این بار با طراحی مدرن و پر بازده‌تری در هر واحد محاسباتی با معماری RDNA رو‌به‌رو هستیم.
هر واحد محاسباتی در طراحی تراشه‌ی Navi 10 شامل یک واحد اسکالر اضافی است.
که وظیفه‌ی آن محاسبات برداری ریاضی و یک زمانبند اضافی است.

با کمک ترکیب این دو، نرخ اجرای دستورالعمل‌ها نسبت به نسل قبل آن تا دو برابر افزایش می‌یابد.

این محصول ترکیبی، برای اجرای انواع گیمینگ و پردازش محیط‌های گرافیکی نسبت
به GCN بسیار کارآمدتر عمل می‌کند.

در معماری جدید چیدمان SIMD­­ها (Single instruction, multiple data)
که به آن دستور چند داده می­گویند، نیز دچار دگرگونی شگرف شده است.
درواقع SIMD رشته‌ای از هسته‌های محاسبه‌گر منطقی (ALU) است.
که هر یک از این هسته‌ها یک تسک کاری یا ترد از دستورالعمل صادرشده را در یک سیکل اجرا می‌کند.
در معماری قدیمی GCN ، هر واحد محاسباتی دربرگیرنده‌ی چهار  SIMD16 یا اصطلاحا ۱۶ هسته­ای است.
در معماری جدید RDNA هر واحد محاسباتی دربردارنده‌ی دو SIMD32 یا ۳۲ هسته ­ای است.
در معماری قدیم GCN یک واحد اسکالر و یک زمانبند درمیان تمام SIMD-ها به اشتراک گذارده شده است.
این در حالی است که هر SIMD در معماری جدید RDNA یک واحد اسکالر
و یک زمانبند مخصوص به خود دارد.
این یکی از نقاط قوت معماری جدی به شمار می‌رود.

مزایای کارت گرافیک GCN در مقابل RDNA

مزایای کارت گرافیک GCN در مقابل RDNA با رسم نمودار

در طراحی قدیمی GCN هر دستورالعمل (در پیچیده‌ترین شرایط) بر جبهه‌ی موجی
با ۶۴ ترد (Wave64) بار شده و برای اجرا به یک SIMD16 واگذار می‌شود.
با وجود این شرایط هر دستورالعمل در چهار سیکل کلاک میان ALU-ها توزیع می­شود.
پس از این توزیع شدت در میان آن‌ها به‌طور کامل اجرا می‌شود.
بنابراین SIMD در معماری قدیمی قادر به پردازش یک دستورالعمل در یک سیکل کلاک واحد نیست.
در این حالت در هر سیکل کلاک فقط از ۲۵ درصد ظرفیت هسته‌های منطقی استفاده می‌شود.
به همین دلیل میزان به‌کارگیری منابع چندان رضایت بخش نیست.

در عوض در معماری جدید RDNA دستورالعملی با ۶۴ تسک کاری به‌صورت
دو جبهه‌ی موج هر یک با ۳۲ ترد (Wave32)  به‌طور هم‌زمان بین ۲ واحد SIMD32 توزیع می‌شود.

به همین دلیل زمان انتظار برای دریافت نتایج پردازش کمتر شده.
همینطور از طرفی ۱۰۰ درصد منابع واحد محاسباتی برای
اجرای بهینه‌ی تردهای پردازشی به‌کارگیری می‌شود.

مزایای کارت گرافیک

مزایای کارت گرافیک Navi نسبت به GCN

معماری  RDNA، با ساده‌سازی دستورالعمل‌های صادر شده.
به شیوه‌ای تأثیرگذار از یک معماری متمرکز بر اجرای محاسبات سنگین،
تبدیل به یک معماری سازگار با کدهای گیمینگ (Game-Freindly) می‌شود.
محاسبات در این معماری کوچک­تر شده است.
به‌جای دستورالعمل­ها در هسته­های ۶۴ تایی،
هر دستورالعمل بر یک هسته ۳۲ تایی بارگذاری شده است.
در ادامه طی یک سیکل کلاک در SIMD32ها اجرا می‌شود.
کامپایلر در این معماری همچنان امکان انتخاب نوع دستورالعمل و شکل اجرای آن را دارد.

در معماری جدید RDNA منابع پردازش دو واحد محاسباتی در مجاورت یکدیگر قرار گرفته.

به کمک موازی­ کاری، امکان بارگذاری و اجرای گروه‌های کاری بزرگتری وجود دارد.
به‌طور کلی می‌توان گفت هدف اصلی در معماری RDNA  کاهش تأخیر،
بهبود عملکرد پردازش Single-Threading و افزایش بازده حافظه‌ی کش در مقایسه با معماری GCN است.
در معماری جدید در هر سیکل کلاک و در هر واحد محاسباتی میزان کار مفید بیشتری انجام می‌پذیرد.

کمپانیAMD  در معماری جدید خود برای کارت گرافیک با الگوبرداری از پردازنده‌های نسل سوم رایزن،
حافظه کش L1  اختصاصی را به تراشه‌ی Navi‌ اضافه کرده.
در این حالت پهنای باند بارگذاری را از نزدیک‌ترین حافظه‌ی کش (L0) به ALU دو برابر کرده است.
در این معماری پهنای باند مؤثر افزایش قابل توجهی می‌یابد.
دلیل آن این است که داده‌های مورد نیاز به‌جای آنکه از
حافظه‌های فریم بافری که کند هستند فراخوانی شوند.
در سطوح مختلف کش پردازنده جایگذاری شده‌اند.
از آنجا با سرعت بیشتری فراخوانی می‌شود.

اگر بخواهیم دو معماری RDNA و GCN را برای کارت گرافیک با یکدیگر مقایسه کنیم.

کمپانی سازنده مدعی است که در سرعت کلاک یکسان معماری جدید ۲۵ درصد سطح عملکرد بهتری ارائه می‌کند.

با درنظرگرفتن کنولوژی ساخت تراشه‌ی ۷ نانومتری Navi نسبت به تراشه‌های  Vega،
معماری RDNA تا ۵۰ درصد سریع‌تر از معماری GCN است.
بنا به گفته کمپانی AMD بهره‌وری توانی (سطح عملکرد به ازای هر وات توان مصرفی)
تراشه‌ی گرافیکی Navi 10 تا ۵۰ درصد بیشتر از GCN است.