اولین بنچمارک A100، پردازنده گرافیکی مبتنی‌بر معماری امپر انویدیا، منتشر شد

{title limit=50}

پردازنده‌ی گرافیکی (GPU) انویدیا Ampere A100 مه ۲۰۲۰ (اردیبهشت و خرداد ۱۳۹۹) معرفی شد؛ اما تا امروز دقیقا نمی‌دانستیم این پردازنده چه قدرتی ارائه می‌دهد. جولز اوربک، بنیان‌گذار و مدیرعامل شرکت نرم‌افزاری OTOY، به‌تازگی توییت جدیدی منتشر کرده که حاوی نخستین بنچمارک منتسب به پردازنده‌ی گرافیکی A100 است.

ظاهرا پردازنده‌ی A100 انویدیا توانسته است در بنچمارک OctaneBench امتیاز ۴۴۶ را کسب کند. این امتیاز A100 را به سریع‌ترین پردازنده‌ی گرافیکی دنیا در بنچمارک OctaneBench تبدیل می‌کند. کارت گرافیک انویدیا Titan V تا پیش از حضور A100 رکورد بیشترین امتیاز بنچمارک OctaneBench را دراختیار داشت و موفق شده بود امتیاز متوسط ۴۰۱ را کسب کند. بدین‌ترتیب، A100 حداکثر ۱۱٫۲ درصد عملکرد پردازشی بهتری از تایتان V دارد. مدیرعامل شرکت OTOY می‌گوید پردازنده‌ی گرافیکی A100 با تنظیمات RTX غیرفعال در بنچمارک جدید حضور پیدا کرده است. 

اگر نگاهی دقیق به مشخصات فنی A100 بیندازیم، عملکرد بهتر این پردازنده‌ی گرافیکی مبتنی‌بر معماری امپر درمقایسه‌با تایتان V آن‌چنان تعجب‌برانگیز نخواهد بود. پردازنده‌ی GA100 که نسخه‌‌ای از A100 به‌حساب می‌آید، ابعادی معادل ۸۲۶ میلی‌مترمربع (mm۲) و ۵۴٫۲ میلیارد ترانزیستور دارد. امکان استفاده از این تعداد ترانزیستور به‌لطف ساخت پردازنده‌ی مذکور با لیتوگرافی هفت‌نانومتری FinFET شرکت TSMC فراهم شده است. پردازنده‌ی گرافیکی GA100 انویدیا به ۱۲۸ واحد SM (چندپردازنده‌ی جریانی) مجهز است که ۸،۱۹۲ هسته‌ی کودا (CUDA) را شامل می‌شود. در نظر داشته باشید پردازنده‌ی A100 از همه‌ی دای (Die) بهره نمی‌گیرد؛ ولی مشخصاتش در نگاه اول تحسین‌برانگیز هستند.

در پردازنده‌ی A100 امپر از ۶،۹۱۲ هسته‌ی کودا به‌همراه ۴۳۲ هسته‌ی تنسور (Tensor) استفاده شده است. دیگر مشخصه‌های مهم این پردازنده‌ی گرافیکی ۴۰ گیگابایت حافظه‌ی HBM2E با رابط حافظه‌ی ۵،۱۲۰ بیت است. این مشخصه‌ها نشان می‌دهد پردازنده‌ی گرافیکی یادشده پهنای باند خیره‌کننده‌ی ۱،۵۵۵ گیگابیت‌بر‌ثانیه را ارائه می‌دهد. در کارت گرافیک تایتان V انویدیا از ۵،۱۲۰ هسته‌ی کودا به‌همراه ۱۲ گیگابایت حافظه‌ی HMB2 استفاده شده است و همین موضوع باعث می‌شود تایتان V قدرت پردازشی کمتری ارائه دهد.

نتایج گرافیک A100 امپر انویدیا در بنچمارک OctaneBench

سرویس OctaneBench با استفاده از ابزار OctaneRender بنچمارک کارت‌های گرافیک را ثبت می‌کند. یکی از پیش‌نیازهای اصلی استفاده از این ابزار، آن است که کارت گرافیک آزمایش‌شده از هسته‌های کودای انویدیا برخوردار باشد. این پیش‌نیاز باعث شده است هیچ‌یک از کارت‌های گرافیک سری رادئون AMD برای حضور در بنچمارک OctaneBench واجد شرایط نباشد. دیتابیس OctaneBench شامل تنوع درخورتوجهی از کارت‌های گرافیک سری جی‌فورس و کوادرو و تسلا است که مقایسه‌ی بین آن‌ها می‌تواند به ما نشان دهد قدرت پردازشی A100 چقدر درخورتوجه است.

کارت گرافیک GeForce RTX 2080 Ti با کسب امتیاز میانگین ۳۰۲ در سیستم رتبه‌بندی OctaneBench، توانسته جایگاه چهاردهم را ازآنِ خود کند. مقایسه‌ای سرانگشتی نشان می‌دهد پردازنده‌ی گرافیکی A100 تقریبا ۴۷٫۷ درصد سریع‌تر از GeForce RTX 2080 Ti است. فراموش نکنید GeForce RTX 2080 Ti یکی از کارت‌های گرافیک قدرتمند بازار به‌حساب می‌آید و قیمت گرانی هم دارد.

همچنین، باید به این نکته توجه کنید که پردازنده‌ی گرافیکی GA100 به‌طور ویژه برای استفاده از دیتاسنترها طراحی شده و بعید است از آن در کارت‌های گرافیک جدید انویدیا استفاده شود که در آینده‌ای نزدیک معرفی می‌شوند. رسانه‌ها به‌نقل از منابعی آگاه، گفته‌اند کارت‌های گرافیک مبتنی‌بر معماری امپر قرار است RTX 3080 و RTX 3090 نام بگیرند. A100 به‌عنوان مدل جدید GV100 (ولتا) شناخته می‌شود؛ بنابراین، احتمال دارد نهایتا در قالب یکی از کارت‌های گرافیک سری Titan دردسترس قرار بگیرد.

مشخصات فنی پردازنده‌ی گرافیکی A100 انویدیا
هفت واحد GPC، هفت یا هشت واحد TPC/GPC، دو واحد SM/TPC، حداکثر ۱۶ واحد SM/GPC و ۱۰۸ واحد SM
۶۴ هسته‌ی کودای FP32 به‌ازای هر واحد SM، درمجموع ۶،۹۱۲ هسته‌ی کودای FP32 به‌ازای کل قدرت پردازشی پردازنده
۴ هسته‌ی تنسور نسل سوم به‌ازای هر واحد SM، درمجموع ۴۳۲ هسته‌ی تنسور نسل سوم به‌ازای کل قدرت پردازشی پردازنده
۵ بسته‌ی HBM2 معادل ۱۰ عدد کنترلر حافظه‌ی ۵۱۲ بیت


طبق ادعای چندین شایعه، کارت‌های گرافیک جریان اصلی (مین استریم) خانواده‌ی امپر قرار است به دای GA102 مجهز شوند. بدیهی است این دای احتمالا از GA102 کوچک‌تر است و به‌دلیل داشتن واحد SM کمتر، قدرت پردازشی ضعیف‌تری ارائه می‌دهد. برخی رسانه‌ها گفته‌اند دای GA102 شامل ۸۴ واحد SM است که به ۵،۳۷۶ هسته‌ی کودا ترجمه می‌شود. این احتمالا همان تراشه‌ای است که انویدیا می‌خواهد در کارت گرافیک GeForce RTX 3080 Ti یا GeForce RTX 3090 استفاده کند. درهرصورت با درنظرگرفتن بهره‌مندی GA102 از هسته‌ی کودای کمتر، بعید است این پردازنده بتواند قدرت بیشتری از GA100 ارائه دهد. البته اگر انویدیا پردازنده‌ی GA102 را با سرعت کلاک چشمگیر تولید کند، تفاوت‌های بین GA102 و GA100 کمتر خواهد شد.

شکی نداریم کارت‌های گرافیک سری امپر قرار است به‌طور محسوس درمقایسه‌با کارت‌های سری تورینگ بهبود پیدا کنند و قدرت پردازشی بسیار زیادی به رایانه‌های شخصی بیاورند. تاکنون، به برخی آمار اشاره شده که براساس آن‌ها می‌توانیم تخمین بزنیم امپر قرار است چقدر قوی‌تر باشد. البته اتکاکردن به آمار کار عاقلانه‌ای نیست و تا زمانی‌که کارت‌های امپر روانه‌ی بازار نشوند، دقیقا قدرت آن‌ها را نخواهیم فهمید. در‌هر‌صورت، انتظار داریم میزان بهبود امپر درمقایسه‌با نسل قبل کمتر از ۴۷٫۷ درصد باشد.

دیدگاه شما کاربران زومیت درباره‌ی این خبر چیست؟ فکر می‌کنید قیمت کارت گرافیک انویدیا برپایه‌ی معماری امپر چقدر تعیین می‌شود؟






ارسال نظر

عکس خوانده نمی‌شود
261