معماری Ampere انویدیا برای پردازنده‌های گرافیکی معرفی شد

انویدیا از مدت‌ها پیش اعلام کرده بود که قصد دارد در جریان برگزاری مراسم GTC 2020 خبری مهم در رابطه‌با پردازنده‌های گرافیکی نسل بعد خود اعلام کند. کنفرانس GTC 2020 درنهایت توسط جن‌سون هوانگ، مدیرعامل انویدیا برگزار شد و در این همایش شاهد معرفی رسمی معماری امپر برای کارت‌های گرافیکی بودیم. انویدیا در جریان برگزاری مراسم روز گذشته، قدرتمندترین پردازنده‌ی گرافیکی خود تا به‌امروز را معرفی کرد؛ پردازنده‌ای گرافیکی که مبتنی‌بر لیتوگرافی ۷ نانومتری است و در دسته‌ی امپر جای می‌گیرد.

انویدیا می‌گوید GA100 نخستین پردازنده‌ی گرافیکی است که از معماری امپر استفاده می‌کند؛ GA100 را می‌توان بزرگ‌ترین پردازنده‌ی گرافیکی به‌حساب آورد که با استفاده از لیتوگرافی ۷ نانومتری انقلابی TSMC ساخته می‌شود. در ادامه تلاش می‌کنیم نگاهی عمیق به معماری امپر انویدیا و به‌خصوص کارت گرافیک ۷ نانومتری GA100 بیاندازیم و مشخصات فنی آن را موردبررسی قرار دهیم.

طبق اعلام رسمی، Ampere GA100 با فاصله‌ی زیاد نسبت‌به رقبا بزرگ‌ترین پردازنده‌ی گرافیکی ۷ نانومتری ساخته‌شده در تاریخ به‌شمار می‌آید. این کارت گرافیک به‌صورت ویژه برای بازار محصولات رایانشی قدرتمند (HPC) نظیر سرورها، حافظه‌های ذخیره‌سازی عمده و موارد مشابه ساخته شده است. از GA100 برای اهدافی نظیر تحقیقات علمی، هوش مصنوعی، شبکه‌‌های عصبی عمیق و AI Inferencing استفاده خواهد شد.

انویدیا امپر / Nvidia Ampere

پردازنده‌ی گرافیکی NVIDIA Ampere GA100 قرار است در چندین فرم فاکتور در دسترس قرار گیرد؛ از کارت‌های یگانه‌ی Mezzanine Modular گرفته تا کارت‌های PCIe 4.0. همچنین پردازنده‌ی گرافیکی موردبحث در چندین پیکربندی تولید خواهد شد، بااین‌حال آنچه انویدیا مانوری ویژه روی آن داده پیکربندی Tesla A100 است که در سیستم‌های DGX A100 و HGX A100 مورداستفاده قرار می‌گیرد.

Ampere GA100 بزرگ‌‌جثه‌ترین پردازنده‌ی گرافیکی ۷ نانومتری دنیا است

وقتی موضوعِ بحث به مشخصات هسته‌های پردازشی Ampere GA100 می‌رسد، این کارت گرافیک جدید در نقش هیولایی بی‌شاخ‌و‌دم ظاهر می‌شود. با درنظرگرفتن اینکه Ampere GA100 مساحت Die معادل ۸۲۶ میلی‌مترمربع (mm^۲) دارد، باید انتظار قدرت پردازشی بسیار بالایی را از آن داشته باشیم، به‌خصوص با دانستن این حقیقت که پردازنده‌ی موردبحث مساحت Die بیشتری نسبت‌به Volta GV100 دارد. طبق مشخصات رسمی، مساحت پردازنده‌ی گرافیکی Volta GV100 به ۸۱۵mm^۲ می‌رسد.

پردازنده‌ی گرافیکی جدید انویدیا نسبت‌به مدل پیشین خود بیش از دو برابر ترانزیستور بیشتری دارد و شمار کل ترانزیستورهای آن به ۵۴ میلیارد عدد رسیده است؛ درحالی که نسل پیش این پردازنده از ۲۱/۱ میلیارد ترانزیستور استفاده می‌کرد. این میزان پیشرفت در نگاه اول تحسین‌برانگیز است و نشان می‌دهد که Ampere GA100 قرار است قدرت پردازشی بسیار زیادی را ارائه دهد. با درنظرگرفتن اندازه‌ی Die و شمار ترانزیستورها می‌توان با اطمینان از GA100 به‌عنوان چگال‌ترین پردازنده‌ی گرافیکی تاریخ یاد کرد.

براساس اعلام رسمی، مشخصات کلیدی پردازنده‌ی گرافیکی NVIDIA Ampere GA100 شامل موارد زیر هستند:

هشت واحد GPC (کلاستر پردازشی گرافیکی)، هشت واحد TPS/GPC، دو واحد SM/TPC، شانزده واحد SM/GPC و ۱۲۸ واحد SM به‌ازای کل قدرت پردازشی پردازنده
۶۴ هسته‌ی کودای FP32 به‌ازای هر واحد SM، درمجموع ۸٬۱۹۲ هسته‌ی کودای FP32 به‌ازای کل قدرت پردازشی پردازنده
۴ هسته‌ی تنسور نسل سوم به‌ازای هر واحد SM، درمجموع ۵۱۲ هسته‌ی تنسور نسل سوم به‌ازای کل قدرت پردازشی پردازنده
۶ بسته‌ی HBM2 معادل ۱۲ عدد کنترلر حافظه‌ی ۵۱۲ بیت

انویدیا امپر / Nvidia Ampere

از طرفی نسخه‌ی ویژه‌ی پردازنده‌ی گرافیکی موردبحث را با نام A100 داریم که ظاهرا از هسته‌های تنسور استفاده می‌کند و مشخصات آن به‌شرح زیر است:

هفت واحد GPC، هفت یا هشت واحد TPC/GPC، دو واحد SM/TPC، حداکثر ۱۶ واحد SM/GPC و ۱۰۸ واحد SM
۶۴ هسته‌ی کودای FP32 به‌ازای هر واحد SM، درمجموع ۶٬۹۱۲ هسته‌ی کودای FP32 به‌ازای کل قدرت پردازشی پردازنده
۴ هسته‌ی تنسور نسل سوم به‌ازای هر واحد SM، درمجموع ۴۳۲ هسته‌ی تنسور نسل سوم به‌ازای کل قدرت پردازشی پردازنده
۵ بسته‌ی HBM2 معادل ۱۰ عدد کنترلر حافظه‌ی ۵۱۲ بیت

پردازنده‌ی گرافیکی Tesla A100 نسبت‌به مدل GA100 قدرت پردازشی به‌نسبت کمتری دارد، زیرا از نسخه‌ی اولیه‌ی لیتوگرافی ۷ نانومتری بهره می‌گیرد؛ بااین‌حال این موضوع به‌معنی ضعف آن نیست. تسلا A100 همچنان قدرت پردازشی بسیار بالایی دارد، به‌خصوص با درنظرگرفتن اندازه‌ی این پردازنده‌ی گرافیکی (انویدیا به‌طور معمول از چنینن پردازنده‌هایی با نام اَبَر GPU یا SUPER GPU یاد می‌کند).

پردازنده‌ی گرافیکی Ampere GA100 میزبان بیش از ۵۴ میلیارد ترانزیستور است

طبق اطلاعات رسمی منتشرشده از سوی انویدیا، نسخه‌ی کامل پردازنده‌ی گرافیکی NVIDIA Ampere GA100 مجهز به ۱۲۸ واحد SM (چندپردازنده‌‌های جریانی) است و ۸٬۱۹۲ هسته‌ی کودا (CUDA) دارد. این اعداد نشان می‌دهند Ampere GA100 نخستین پردازنده‌ی گرافیکی دنیا است که این حجم از هسته‌های کودا را روی یک Die جای می‌دهد.

آن‌طور که انویدیا می‌گوید پردازنده‌ی موردبحث ۸٬۱۹۲ هسته‌ی سری FP32 دارد، از ۴٬۰۹۶ هسته‌ی FP64 بهره می‌برد و به ۵۱۲ هسته‌ی تنسور مجهز شده است. این پردازنده‌ی گرافیکی مجهزبه ۸ کلاستر پردازشی گرافیکی است که هر یک از آن‌ها شامل ۱۶ واحد SM و ۸ واحد TPC می‌شوند. مدل Tesla A100 پردازنده‌ی گرافیکی قدرتمند انویدیا دارای توان طراحی حرارتی (TDP) معادل ۴۰۰ وات است.

انویدیا می‌گوید پردازنده‌ی گرافیکی A100 از لحاظ طراحی فنی، محصولی انقلابی به‌حساب می‌آید و پنج ویژگی کلیدی دارد. ویژگی اول، همان معماری امپر است. امپر در قلب تپنده‌ی پردازنده‌ی A100 جای دارد و باعث شده این پردازنده بتواند میزبان بیش از ۵۴ میلیارد ترانزیستور باشد. بهره‌مندی از چنین تعدادی از ترانزیستور، پردازنده‌ی گرافیکی A100 را به بزرگ‌ترین پردازنده‌ی ۷ نانومتری دنیا تبدیل می‌کند. ویژگی کلیدی دوم پردازنده به بهره‌مندی آن از هسته‌های تنسور نسل سوم TF32 بازمی‌گردد.

مقایسه‌ی پردازنده‌ی گرافیکی Tesla A100 امپر با نسل‌های گذشته
پارامتر / نام پردازنده‌ی گرافیکی	Tesla K40 (PCI-Express)	Tesla M40 (PCI-Express)	Tesla P100 (PCI-Express)	(Tesla P100 (SXM2	(Tesla V100 (SXM2	(Tesla V100S (PCIe	(Tesla A100 (SXM4
واحد پردازش گرافیکی (GPU)	GK110 (معماری کپلر)	GM200 (معماری مکس‌ول)	GP100 (معماری پاسکال)	GP100 (معماری پاسکال)	GV100 (معماری وُلتا)	GV100 (معماری وُلتا)	GA100 (معماری امپر)
لیتوگرافی (نود پردازشی)	۲۸ نانومتری	۲۸ نانومتری	۱۶ نانومتری	۱۶ نانومتری	۱۲ نانومتری	۱۲ نانومتری	۷ نانومتری
شمار ترانزیستورها	۷/۱ میلیارد	۸ میلیارد	۱۵/۳ میلیارد	۱۵/۳ میلیارد	۲۱/۱ میلیارد	۲۱/۱ میلیارد	۵۴/۲ میلیارد
اندازه‌ی Die واحد پردازش گرافیکی	۵۵۱ میلی‌متر مربع	۶۰۱ میلی‌متر مربع	۶۱۰ میلی‌متر مربع	۶۱۰ میلی‌متر مربع	۸۱۵ میلی‌متر مربع	۸۱۵ میلی‌متر مربع	۸۲۶ میلی‌متر مربع
شمار واحدهای SM	۱۵	۲۴	۵۶	۵۶	۸۰	۸۰	۱۰۸
شمار واحدهای TPC	۱۵	۲۴	۲۸	۲۸	۴۰	۴۰	۵۴
شمار هسته‌های کودای FP32 به‌ازای هر واحد SM	۱۹۲	۱۲۸	۶۴	۶۴	۶۴	۶۴	۶۴
شمار هسته‌های کودای FP64 به‌ازای هر واحد SM	۶۴	۴	۳۲	۳۲	۳۲	۳۲	۳۲
شمار کل هسته‌های کودای FP32	۲٬۸۸۰	۳٬۰۷۲	۳٬۵۸۴	۳٬۵۸۴	۵٬۱۲۰	۵٬۱۲۰	۶٬۹۱۲
شمار کل هسته‌‌های کودای FP64	۹۶۰	۹۶	۱٬۷۹۲	۱٬۷۹۲	۲٬۵۶۰	۲٬۵۶۰	۳٬۴۵۶
شمار هسته‌های تنسور	-	-	-	-	۶۴۰	۶۴۰	۴۳۲
شمار واحدهای بافتی	۲۴۰	۱۹۲	۲۲۴	۲۲۴	۳۲۰	۳۲۰	۴۳۲
سرعت کلاک پایه	۷۴۵ مگاهرتز	۹۴۸ مگاهرتز	۱٬۱۹۰ مگاهرتز	۱٬۳۲۸ مگاهرتز	۱٬۲۹۷ مگاهرتز	نامشخص	نامشخص
سرعت کلاک تقویت‌شده (بوست)	۸۷۵ مگاهرتز	۱٬۱۱۴ مگاهرتز	۱٬۳۲۹ مگاهرتز	۱٬۴۸۰ مگاهرتز	۱٬۵۳۰ مگاهرتز	۱٬۶۰۱ مگاهرتز	۱٬۴۱۰ مگاهرتز
شمار واحدهای تاپس (DNN/AI)	-	-	-	-	۱۲۵ تاپس	۱۳۰ تاپس	۱٬۲۴۸ تاپس (یا ۲٬۴۹۶ تاپس با Sparsity)
قدرت پردازشی FP16	-	-	۱۸/۷ فلاپس	۲۱/۲ فلاپس	۳۰/۴ فلاپس	۳۲/۸ فلاپس	۳۱۲ فلاپس (یا ۶۲۴ فلاپس با Sparsity)
قدرت پردازشی FP32	۵/۰۴ ترافلاپس	۶/۸ ترافلاپس	۱۰ ترافلاپس	۱۰/۶ ترافلاپس	۱۵/۷ ترافلاپس	۱۶/۴ ترافلاپس	۱۹/۵ ترافلاپس در حالت استاندارد و ۱۵۶ ترافلاپس تحت شرایط خاص
قدرت پردازشی FP64	۱/۶۸ ترافلاپس	۰/۲ ترافلاپس	۴/۷ ترافلاپس	۵/۳ ترافلاپس	۷/۸ ترافلاپس	۸/۲ ترافلاپس	۹/۷ ترافلاپس در حالت استاندارد و ۱۹/۵ ترافلاپس تحت شرایط خاص
رابط حافظه	۳۸۴ بیت GDDR5	۳۸۴ بیت GDDR5	۴٬۰۹۶ بیت HBM2	۴٬۰۹۶ بیت HBM2	۴٬۰۹۶ بیت HBM2	۴٬۰۹۶ بیت HBM2	۶٬۱۴۴ بیت HBM2e
ظرفیت حافظه	۱۲ گیگابایت GDDR5 با پهنای باند ۲۸۸ گیگابیت‌بر‌ثانیه	۲۴ گیگابایت GDDR5 با پهنای باند ۲۸۸ گیگابیت‌بر‌ثانیه	۱۶ گیگابایت HBM2 با پهنای باند ۷۳۲ گیگابیت‌بر‌ثانیه یا ۱۲ گیگابایت HB2 با پهنای باند ۵۴۹ گیگابیت‌بر‌ثانیه	۱۶ گیگابایت HBM2 با پهنای باند ۷۳۲ گیگابیت‌بر‌ثانیه	۱۶ گیگابایت HBM2 با پهنای باند ۹۰۰ گیگابیت‌بر‌ثانیه	۱۶ گیگابایت HBM2 با پهنای باند ۱٬۱۳۴ گیگابیت‌بر‌ثانیه	۴۰ گیگابایت HBM2 با پهنای باند ۱/۶ ترابیت‌بر‌ثانیه
اندازه‌ی حافظه‌ی کش L2	۱٬۵۳۶ کیلوبایت	۳٬۰۷۲ کیلوبایت	۴٬۰۹۶ کیلوبایت	۴٬۰۹۶ کیلوبایت	۶٬۱۴۴ کیلوبایت	۶٬۱۴۴ کیلوبایت	۴۰٬۹۶۰ کیلوبایت
توان طراحی حرارتی (TDP)	۲۳۵ وات	۲۵۰ وات	۲۵۰ وات	۳۰۰ وات	۳۰۰ وات	۲۵۰ وات	۴۰۰ وات

هسته‌های سری تنسور که به‌شکلی گسترده مورداستفاده قرار گرفته‌اند اکنون سرعت پردازشی بیشتری دارند و استفاده از آن‌ها راحت‌تر است. امروزه هسته‌های تنسور نسل سوم TF32 می‌توانند در حوزه‌ی هوش مصنوعی ۲۰ درصد عملکردی بهتر نسبت‌به نسل‌های گذشته از خود نشان دهند. ناگفته نماند که هسته‌های تنسور اکنون از FP64 نیز پشتیبانی می‌کنند. بهره‌مندی از FP64 باعث می‌شود این هسته‌ها بتوانند هنگام انجام پردازش‌های مربوط‌به بازار HPC به‌میزان ۲/۵ برابر قدرت رایانشی بیشتری ارائه دهند.

ویژگی کلیدی سوم پردازنده‌ی انویدیا بهره‌مندی از قابلیت فنی MIG است. به‌لطف MIG، پردازنده‌ی A100 به هفت قسمت تقسیم می‌شود تا بتواند برای اهداف مختلف، قدرت پردازشی متنوعی را ارائه دهد. بدین ترتیب A100 می‌تواند تشخیص دهد که برای انجام وظیفه‌ای خاص باید چه‌میزان قدرت رایانشی ارائه شود. MIG باعث می‌شود میزان بهینه‌سازی پردازنده به حداکثر برسد و بازده آن بالا رود. انویدیا از NVLink به‌عنوان ویژگی کلیدی چهارم پردازنده‌ی گرافیکی A100 یاد می‌کند. همچینن طبق گفته‌ی انویدیا ساخته‌شدن پردازنده‌ی جدید با اتکا بر تکنیک Structural Sparsity پنجمین ویژگی کلیدی آن است.

انویدیا پردازنده‌ی گرافیکی Ampere GA100 را در چندین مدل با مشخصات مختلف تولید می‌کند

دیگر مشخصات مهم پردازنده‌ی NVIDIA Ampere GA100 شامل بهره‌مندی آن از رابط حافظه‌ی ۶٬۱۴۴ بیت است که شامل حداکثر ۴۸ گیگابایت حافظه‌ی HBM2e در ۶ بسته‌ی HBM2 می‌شود؛ این بسته‌ها به‌صورت پراکنده در اطراف Die پردازنده‌ی گرافیکی جای گرفته‌اند. هر یک از بسته‌های موردبحث به‌ازای هر دای دارای ۲ گیگابایت حافظه‌ی گرافیکی (VRAM) هستند؛ بنابراین برای دستیابی به ۴۸ گیگابایت حافظه به بسته‌های 4Hi نیاز پیدا خواهید کرد. هر بسته‌ی 4Hi توانایی جای دادن ۸ گیگابایت حافظه را در خود دارد؛‌ بنابراین ۶ بسته‌ی 4Hi در کنار هم می‌توانند ۴۸ گیگابایت حافظه‌ی گرافیکی را ارائه دهند که عددی بسیار درخورتوجه است. ظاهرا حافظه‌ی پردازنده می‌تواند پهنای باند حدودا ۱/۶ ترابیت‌بر‌ثانیه را ارائه دهد.

پردازنده‌ی گرافیکی امپر انویدیا قرار است دارای چندین پیکربندی برای حافظه‌ی HBM باشد، بااین‌حال به‌طور کلی حافظه‌ی ارائه‌شده نهایتا ۴۸ گیگابایت خواهد بود؛ مگر اینکه انویدیا بخواهد در آینده پیکربندی‌های دیگری را با بسته‌های 6Hi یا حتی 8Hi ارائه دهد که به‌ترتیب می‌توانند سقف حافظه را به ۷۲ و ۹۶ گیگابایت ارتقاء دهند. پردازنده‌ی گرافیکی Tesla V100S انویدیا دوبرابر ظرفیت حافظه‌ی HBM بیشتر نسبت‌به Tesla V100 دارد و ظرفیت آن به ۳۲ گیگابایت می‌رسد. با درنظرگرفتن همین موضوع احتمال می‌دهیم انویدیا بخواهد چنین رویکردی را برای یکی دیگر از مدل‌های آینده‌ی Tesla A100 تکرار کند.

تصویر زیر، طرح بلوک‌های پردازنده‌ی گرافیکی NVIDIA Ampere GA100 را نشان می‌دهد:

^{برای مشاهده‌ی تصویر بالا در ابعاد اصلی روی آن کلیک کنید}

به‌علاوه در تصویر زیر می‌توانید نظاره‌گر طرح بلوک‌های SM پردازنده‌ی NVIDIA Ampere GA100 باشید:

^{برای مشاهده‌ی تصویر بالا در ابعاد اصلی روی آن کلیک کنید}

پس از بررسی دقیق مشخصات فنی نسخه‌ی کامل پردازنده‌ی گرافیکی جدید انویدیا، بهتر است به بیان برخی نکات درمورد شتاب‌دهنده‌ی گرافیکی Tesla A100 نیز بپردازیم. Tesla A100 نسخه‌ی ضعیف‌تر Ampere GA100 به‌حساب می‌آید و به ۱۰۸ واحد SM مجهز شده است. این پردازنده‌ی گرافیکی ۶٬۹۱۲ هسته‌ی FP32 به‌همراه ۳٬۴۵۶ هسته‌ی FP64 و ۴۳۲ هسته‌ی تنسور دارد. طبق اطلاعات رسمی، Tesla A100 دارای رابط باس ۵٬۱۲۰ بیت است و حداکثر ظرفیت حافظه‌ی گرافیکی HBM2 آن به ۴۰ گیگابایت می‌رسد. این پردازنده‌ی گرافیکی از برخی جوانب جلب ‌توجه می‌کند. خصوصا به‌ این دلیل که استفاده از ۴۰ گیگابایت حافظه‌ی HBM2 به‌معنی استفاده از بسته‌های 5Hi خواهد بود که البته چنین اتفاقی دور از انتظار به‌نظر می‌رسد. به‌جای آن، احتمال می‌دهیم پردازنده‌ی موردبحث به بسته‌های 6Hi با تراشه‌ی DRAM ناقص روی هر بسته، مجهز شده باشد.

NVIDIA Ampere Tesla A100 دارای توان طراحی حرارتی ۴۰۰ وات است

آن‌طور که انویدیا می‌گوید پردازنده‌ی NVIDIA Ampere Tesla A100 دارای توان طراحی حرارتی ۴۰۰ وات است؛ یعنی ۱۰۰ وات بیشتر از مدل Tesla V100 Mezzanine. مدل PCIe پردازنده از توان طراحی حرارتی ۳۰۰ وات استفاده می‌کند، بااین‌حال نسبت‌به مدل مزانین (Mezzanine) سرعت کلاک پایین‌تری دارد. مدل Mezzanine ازطریق سوئیچ‌های جدید NVLINK، دارای رابط GPU به GPU است. ازطرفی مدل PCIe را داریم که از سوئیچ ملناکس (Mellanox) به‌همراه دو رابط NVLINK نسل جدید و دو درگاه EDR استفاده می‌کند.

در زمینه‌ی عملکرد پردازشی، NVIDIA Ampere GA100 قدرت یک Peta-OP را ارائه می‌دهد که به‌میزان ۲۰ برابر بیشتر از قدرت ارائه‌شده توسط Volta GV100 است. همچنین طبق گفته‌ی انویدیا پردازنده‌ی Ampere GA100 نسبت‌به Volta GV100 تا ۲٫۵ برابر عملکردی بهتر در زمینه‌ی پردازش فرمت نقطه شناور دقت دوگانه (Double-Precision Floating-Point Format) از خود برجای می‌گذارد که احتمالا به قدرت پردازشی حدودا ۱۹٫۵ ترافلاپس FP64 منتهی می‌شود؛ به‌خصوص با درنظرگرفتن این حقیقت که قدرت پردازشی پردازنده‌ی Volta به حدود ۸ ترافلاپس FP64 می‌رسد. این موضوع نشان می‌دهد که عملکرد پردازنده‌ی جدید در زمینه‌ی پردازش فرمت نقطه شناور دقت یگانه به حداکثر ۱۵۶ ترافلاپس FP32 می‌رسد که برای بازار محصولات HPC عددی دیوانه‌وار است.

پردازند‌ه‌ی Tesla V100 انویدیا که بر پایه‌ی پردازنده‌ی Ampere GA100 ساخته شده است قرار است در سیستم‌های DGX A100 و HGX A100 این شرکت مورداستفاده قرار گیرد. سیستم‌های DGX به‌صورت مطلق روی تحقیقات مبتنی‌بر هوش مصنوعی و همچنین پردازش‌های متنوع بازار HPC متکی هستند. از طرفی سیستم‌های HGX را داریم که طبق گفته‌ی انویدیا قدرت پردازشی خودشان را روی حوزه‌ی رایانش ابری (Cloud Computing) یا دیتاسنترها متمرکز می‌کنند. سیستم‌های موردبحث انویدیا با نام دقیق DGX-A100 و HGX-A100 شناخته می‌شوند و نسل سوم سیستم‌های DGX و HGX به‌حساب می‌آیند.

انویدیا امپر

مقاله‌ی مرتبط:

انویدیا ویدیویی از سیستم DGX A100 مجهز به پردازنده گرافیکی امپر منتشر کرد

شماری از شرکای تجاری انویدیا پیش‌تر به‌صورت رسمی اعلام کرده‌اند که قصد دارند در برخی سرورهای جدید خود از پردازنده‌های جدید انویدیا استفاده کنند؛ این سرورها در دسته‌ی سرورهای 1U و 2U و 4U و حتی حداکثر 10U جای می‌گیرند (توضیحات بیشتر درمورد واحدهای یادشده را در این‌جا بخوانید). براساس اطلاعات رسمی هر یک از این سرورها مجهزبه حداکثر ۸ تراشه‌ی Tesla A100 مبتنی‌بر Ampere GA100 هستند و از لاین‌های PCIe Gen 4.0 استفاده می‌کنند.

جن‌سون هوانگ چند روز پیش در ویدئویی کوتاه به‌صورت مختصر‌به نسل بعدی سیستم DGX-A100 اشاره کرد که انویدیا به‌زودی به‌صورت کامل از آن پرده‌برداری می‌کند. ظاهرا نسل بعدی DGX-A100 خواهد توانست به‌لطف بهره‌مندی از ۸ پردازنده‌ی Tesla A100 حداکثر ۵ ترافلاپس قدرت پردازشی ارائه دهد. گفته می‌شود این سیستم به‌میزان ۲۰ برابر سریع‌تر از نسل پیش است که از پردازنده‌های مبتنی‌بر معماری Volta استفاده می‌کرد. سیستم مبتنی‌بر امپر DGX-A100 انویدیا از روز گذشته با قیمت پایه‌ی ۱۹۹٬۰۰۰ دلار روانه‌ی بازار شده است.

شما کاربران زومیت چه دیدگاهی درمورد معماری امپر انویدیا دارید؟

مشخصات فنی کامل، بهترین قیمت کارت گرافیک انویدیا در فروشگاه‌های اینترنتی و مقایسه‌ی محصولات این شرکت با یکدیگر و کارت گرافیک های AMD را در بخش محصولات زومیت مشاهده کنید. محصولات متنوعی از سری‌‌ Geforce و محصولات حرفه‌ای Quadro در این بخش برای خرید و مقایسه در اختیار کاربران قرار گرفته است.

ورود به بخش کارت گرافیک انویدیا

بلاگ / تکنولوژی

SaReL
0
344

ش	ی	د	س	چ	پ	ج
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

معماری Ampere انویدیا برای پردازنده‌های گرافیکی معرفی شد

مقاله‌ی مرتبط:

ارسال نظر