معماری Ampere انویدیا برای پردازنده‌های گرافیکی معرفی شد

{title limit=50}

انویدیا از مدت‌ها پیش اعلام کرده بود که قصد دارد در جریان برگزاری مراسم GTC 2020 خبری مهم در رابطه‌با پردازنده‌های گرافیکی نسل بعد خود اعلام کند. کنفرانس GTC 2020 درنهایت توسط جن‌سون هوانگ، مدیرعامل انویدیا برگزار شد و در این همایش شاهد معرفی رسمی معماری امپر برای کارت‌های گرافیکی بودیم. انویدیا در جریان برگزاری مراسم روز گذشته، قدرتمندترین پردازنده‌ی گرافیکی خود تا به‌امروز را معرفی کرد؛ پردازنده‌ای گرافیکی که مبتنی‌بر لیتوگرافی ۷ نانومتری است و در دسته‌ی امپر جای می‌گیرد.

انویدیا می‌گوید GA100 نخستین پردازنده‌ی گرافیکی است که از معماری امپر استفاده می‌کند؛ GA100 را می‌توان بزرگ‌ترین پردازنده‌ی گرافیکی به‌حساب آورد که با استفاده از لیتوگرافی ۷ نانومتری انقلابی TSMC ساخته می‌شود. در ادامه تلاش می‌کنیم نگاهی عمیق به معماری امپر انویدیا و به‌خصوص کارت گرافیک ۷ نانومتری GA100 بیاندازیم و مشخصات فنی آن را موردبررسی قرار دهیم. 

طبق اعلام رسمی، Ampere GA100 با فاصله‌ی زیاد نسبت‌به رقبا بزرگ‌ترین پردازنده‌ی گرافیکی ۷ نانومتری ساخته‌شده در تاریخ به‌شمار می‌آید. این کارت گرافیک به‌صورت ویژه برای بازار محصولات رایانشی قدرتمند (HPC) نظیر سرورها، حافظه‌های ذخیره‌سازی عمده و موارد مشابه ساخته شده است. از GA100 برای اهدافی نظیر تحقیقات علمی، هوش مصنوعی، شبکه‌‌های عصبی عمیق و AI Inferencing استفاده خواهد شد. 

انویدیا امپر / Nvidia Ampere

پردازنده‌ی گرافیکی NVIDIA Ampere GA100 قرار است در چندین فرم فاکتور در دسترس قرار گیرد؛ از کارت‌های یگانه‌ی Mezzanine Modular گرفته تا کارت‌های PCIe 4.0. همچنین پردازنده‌ی گرافیکی موردبحث در چندین پیکربندی تولید خواهد شد، بااین‌حال آنچه انویدیا مانوری ویژه روی آن داده پیکربندی Tesla A100 است که در سیستم‌های DGX A100 و HGX A100 مورداستفاده قرار می‌گیرد. 

Ampere GA100 بزرگ‌‌جثه‌ترین پردازنده‌ی گرافیکی ۷ نانومتری دنیا است

وقتی موضوعِ بحث به مشخصات هسته‌های پردازشی Ampere GA100 می‌رسد، این کارت گرافیک جدید در نقش هیولایی بی‌شاخ‌و‌دم ظاهر می‌شود. با درنظرگرفتن اینکه Ampere GA100 مساحت Die معادل ۸۲۶ میلی‌مترمربع (mm۲) دارد، باید انتظار قدرت پردازشی بسیار بالایی را از آن داشته باشیم، به‌خصوص با دانستن این حقیقت که پردازنده‌ی موردبحث مساحت Die بیشتری نسبت‌به Volta GV100 دارد. طبق مشخصات رسمی، مساحت پردازنده‌ی گرافیکی Volta GV100 به ۸۱۵mm۲ می‌رسد.

پردازنده‌ی گرافیکی جدید انویدیا نسبت‌به مدل پیشین خود بیش از دو برابر ترانزیستور بیشتری دارد و شمار کل ترانزیستورهای آن به ۵۴ میلیارد عدد رسیده است؛ درحالی که نسل پیش این پردازنده از ۲۱/۱ میلیارد ترانزیستور استفاده می‌کرد. این میزان پیشرفت در نگاه اول تحسین‌برانگیز است و نشان می‌دهد که Ampere GA100 قرار است قدرت پردازشی بسیار زیادی را ارائه دهد. با درنظرگرفتن اندازه‌ی Die و شمار ترانزیستورها می‌توان با اطمینان از GA100 به‌عنوان چگال‌ترین پردازنده‌ی گرافیکی تاریخ یاد کرد. 

براساس اعلام رسمی، مشخصات کلیدی پردازنده‌ی گرافیکی NVIDIA Ampere GA100 شامل موارد زیر هستند:

  • هشت واحد GPC (کلاستر پردازشی گرافیکی)، هشت واحد TPS/GPC، دو واحد SM/TPC، شانزده واحد SM/GPC و ۱۲۸ واحد SM به‌ازای کل قدرت پردازشی پردازنده
  • ۶۴ هسته‌ی کودای FP32 به‌ازای هر واحد SM، درمجموع ۸٬۱۹۲ هسته‌ی کودای FP32 به‌ازای کل قدرت پردازشی پردازنده
  • ۴ هسته‌ی تنسور نسل سوم به‌ازای هر واحد SM، درمجموع ۵۱۲ هسته‌ی تنسور نسل سوم به‌ازای کل قدرت پردازشی پردازنده
  • ۶ بسته‌ی HBM2 معادل ۱۲ عدد کنترلر حافظه‌ی ۵۱۲ بیت

انویدیا امپر / Nvidia Ampere

از طرفی نسخه‌ی ویژه‌ی پردازنده‌ی گرافیکی موردبحث را با نام A100 داریم که ظاهرا از هسته‌های تنسور استفاده می‌کند و مشخصات آن به‌شرح زیر است:

  • هفت واحد GPC، هفت یا هشت واحد TPC/GPC، دو واحد SM/TPC، حداکثر ۱۶ واحد SM/GPC و ۱۰۸ واحد SM
  • ۶۴ هسته‌ی کودای FP32 به‌ازای هر واحد SM، درمجموع ۶٬۹۱۲ هسته‌ی کودای FP32 به‌ازای کل قدرت پردازشی پردازنده
  • ۴ هسته‌ی تنسور نسل سوم به‌ازای هر واحد SM، درمجموع ۴۳۲ هسته‌ی تنسور نسل سوم به‌ازای کل قدرت پردازشی پردازنده
  • ۵ بسته‌ی HBM2 معادل ۱۰ عدد کنترلر حافظه‌ی ۵۱۲ بیت

پردازنده‌ی گرافیکی Tesla A100 نسبت‌به مدل GA100 قدرت پردازشی به‌نسبت کمتری دارد، زیرا از نسخه‌ی اولیه‌ی لیتوگرافی ۷ نانومتری بهره می‌گیرد؛ بااین‌حال این موضوع به‌معنی ضعف آن نیست. تسلا A100 همچنان قدرت پردازشی بسیار بالایی دارد، به‌خصوص با درنظرگرفتن اندازه‌ی این پردازنده‌ی گرافیکی (انویدیا به‌طور معمول از چنینن پردازنده‌هایی با نام اَبَر GPU یا SUPER GPU یاد می‌کند). 

پردازنده‌ی گرافیکی Ampere GA100 میزبان بیش از ۵۴ میلیارد ترانزیستور است

طبق اطلاعات رسمی منتشرشده از سوی انویدیا، نسخه‌ی کامل پردازنده‌ی گرافیکی NVIDIA Ampere GA100 مجهز به ۱۲۸ واحد SM (چندپردازنده‌‌های جریانی) است و ۸٬۱۹۲ هسته‌ی کودا (CUDA) دارد. این اعداد نشان می‌دهند Ampere GA100 نخستین پردازنده‌ی گرافیکی دنیا است که این حجم از هسته‌های کودا را روی یک Die جای می‌دهد.

آن‌طور که انویدیا می‌گوید پردازنده‌ی موردبحث ۸٬۱۹۲ هسته‌ی سری FP32 دارد، از ۴٬۰۹۶ هسته‌ی FP64 بهره می‌برد و به ۵۱۲ هسته‌ی تنسور مجهز شده است. این پردازنده‌ی گرافیکی مجهزبه ۸ کلاستر پردازشی گرافیکی است که هر یک از آن‌ها شامل ۱۶ واحد SM و ۸ واحد TPC می‌شوند. مدل Tesla A100 پردازنده‌ی گرافیکی قدرتمند انویدیا دارای توان طراحی حرارتی (TDP) معادل ۴۰۰ وات است. 

انویدیا می‌گوید پردازنده‌ی گرافیکی A100 از لحاظ طراحی فنی، محصولی انقلابی به‌حساب می‌آید و پنج ویژگی کلیدی دارد. ویژگی اول، همان معماری امپر است. امپر در قلب تپنده‌ی پردازنده‌ی A100 جای دارد و باعث شده این پردازنده بتواند میزبان بیش از ۵۴ میلیارد ترانزیستور باشد. بهره‌مندی از چنین تعدادی از ترانزیستور، پردازنده‌ی گرافیکی A100 را به بزرگ‌ترین پردازنده‌ی ۷ نانومتری دنیا تبدیل می‌کند. ویژگی کلیدی دوم پردازنده به بهره‌مندی آن از هسته‌های تنسور نسل سوم TF32 بازمی‌گردد.

مقایسه‌ی پردازنده‌ی گرافیکی Tesla A100 امپر با نسل‌های گذشته
پارامتر / نام پردازنده‌ی گرافیکیTesla K40

(PCI-Express)

Tesla M40

(PCI-Express)

Tesla P100

(PCI-Express)

(Tesla P100 (SXM2(Tesla V100 (SXM2(Tesla V100S (PCIe(Tesla A100 (SXM4
واحد پردازش گرافیکی (GPU)GK110 (معماری کپلر)GM200 (معماری مکس‌ول)GP100 (معماری پاسکال)GP100 (معماری پاسکال)GV100 (معماری وُلتا)GV100 (معماری وُلتا)GA100 (معماری امپر)
لیتوگرافی (نود پردازشی)۲۸ نانومتری۲۸ نانومتری۱۶ نانومتری۱۶ نانومتری۱۲ نانومتری۱۲ نانومتری۷ نانومتری
شمار ترانزیستورها۷/۱ میلیارد۸ میلیارد۱۵/۳ میلیارد۱۵/۳ میلیارد۲۱/۱ میلیارد۲۱/۱ میلیارد۵۴/۲ میلیارد
اندازه‌ی Die واحد پردازش گرافیکی۵۵۱ میلی‌متر مربع۶۰۱ میلی‌متر مربع۶۱۰ میلی‌متر مربع۶۱۰ میلی‌متر مربع۸۱۵ میلی‌متر مربع۸۱۵ میلی‌متر مربع۸۲۶ میلی‌متر مربع
شمار واحدهای SM۱۵۲۴۵۶۵۶۸۰۸۰۱۰۸
شمار واحدهای TPC۱۵۲۴۲۸۲۸۴۰۴۰۵۴
شمار هسته‌های کودای FP32 به‌ازای هر واحد SM۱۹۲۱۲۸۶۴۶۴۶۴۶۴۶۴
شمار هسته‌های کودای FP64 به‌ازای هر واحد SM۶۴۴۳۲۳۲۳۲۳۲۳۲
شمار کل هسته‌های کودای FP32 ۲٬۸۸۰۳٬۰۷۲۳٬۵۸۴۳٬۵۸۴۵٬۱۲۰۵٬۱۲۰۶٬۹۱۲
شمار کل هسته‌‌های کودای FP64۹۶۰۹۶۱٬۷۹۲۱٬۷۹۲۲٬۵۶۰۲٬۵۶۰۳٬۴۵۶
شمار هسته‌های تنسور----۶۴۰۶۴۰۴۳۲
شمار واحدهای بافتی۲۴۰۱۹۲۲۲۴۲۲۴۳۲۰۳۲۰۴۳۲
سرعت کلاک پایه۷۴۵ مگاهرتز۹۴۸ مگاهرتز۱٬۱۹۰ مگاهرتز۱٬۳۲۸ مگاهرتز۱٬۲۹۷ مگاهرتزنامشخصنامشخص
سرعت کلاک تقویت‌شده (بوست)۸۷۵ مگاهرتز۱٬۱۱۴ مگاهرتز۱٬۳۲۹ مگاهرتز۱٬۴۸۰ مگاهرتز۱٬۵۳۰ مگاهرتز۱٬۶۰۱ مگاهرتز۱٬۴۱۰ مگاهرتز
شمار واحدهای تاپس (DNN/AI)----۱۲۵ تاپس۱۳۰ تاپس۱٬۲۴۸ تاپس (یا ۲٬۴۹۶ تاپس با Sparsity)
قدرت پردازشی FP16 --۱۸/۷ فلاپس۲۱/۲ فلاپس۳۰/۴ فلاپس۳۲/۸ فلاپس۳۱۲ فلاپس (یا ۶۲۴ فلاپس با Sparsity)
قدرت پردازشی FP32 ۵/۰۴ ترافلاپس۶/۸ ترافلاپس۱۰ ترافلاپس۱۰/۶ ترافلاپس۱۵/۷ ترافلاپس۱۶/۴ ترافلاپس۱۹/۵ ترافلاپس در حالت استاندارد و ۱۵۶ ترافلاپس تحت شرایط خاص
قدرت پردازشی FP64 ۱/۶۸ ترافلاپس۰/۲ ترافلاپس۴/۷ ترافلاپس۵/۳ ترافلاپس۷/۸ ترافلاپس۸/۲ ترافلاپس۹/۷ ترافلاپس در حالت استاندارد و ۱۹/۵ ترافلاپس تحت شرایط خاص
رابط حافظه۳۸۴ بیت GDDR5۳۸۴ بیت GDDR5۴٬۰۹۶ بیت HBM2۴٬۰۹۶ بیت HBM2۴٬۰۹۶ بیت HBM2۴٬۰۹۶ بیت HBM2۶٬۱۴۴ بیت HBM2e
ظرفیت حافظه۱۲ گیگابایت GDDR5 با پهنای باند ۲۸۸ گیگابیت‌بر‌ثانیه۲۴ گیگابایت GDDR5 با پهنای باند ۲۸۸ گیگابیت‌بر‌ثانیه۱۶ گیگابایت HBM2 با پهنای باند ۷۳۲ گیگابیت‌بر‌ثانیه یا ۱۲ گیگابایت HB2 با پهنای باند ۵۴۹ گیگابیت‌بر‌ثانیه۱۶ گیگابایت HBM2 با پهنای باند ۷۳۲ گیگابیت‌بر‌ثانیه۱۶ گیگابایت HBM2 با پهنای باند ۹۰۰ گیگابیت‌بر‌ثانیه۱۶ گیگابایت HBM2 با پهنای باند ۱٬۱۳۴ گیگابیت‌بر‌ثانیه۴۰ گیگابایت HBM2 با پهنای باند ۱/۶ ترابیت‌بر‌ثانیه
اندازه‌ی حافظه‌ی کش L2۱٬۵۳۶ کیلوبایت۳٬۰۷۲ کیلوبایت۴٬۰۹۶ کیلوبایت۴٬۰۹۶ کیلوبایت۶٬۱۴۴ کیلوبایت۶٬۱۴۴ کیلوبایت۴۰٬۹۶۰ کیلوبایت
توان طراحی حرارتی (TDP)۲۳۵ وات۲۵۰ وات۲۵۰ وات۳۰۰ وات۳۰۰ وات۲۵۰ وات۴۰۰ وات

هسته‌های سری تنسور که به‌شکلی گسترده مورداستفاده قرار گرفته‌اند اکنون سرعت پردازشی بیشتری دارند و استفاده از آن‌ها راحت‌تر است. امروزه هسته‌های تنسور نسل سوم TF32 می‌توانند در حوزه‌ی هوش مصنوعی ۲۰ درصد عملکردی بهتر نسبت‌به نسل‌های گذشته از خود نشان دهند. ناگفته نماند که هسته‌های تنسور اکنون از FP64 نیز پشتیبانی می‌کنند. بهره‌مندی از FP64 باعث می‌شود این هسته‌ها بتوانند هنگام انجام پردازش‌های مربوط‌به بازار HPC به‌میزان ۲/۵ برابر قدرت رایانشی بیشتری ارائه دهند.

ویژگی کلیدی سوم پردازنده‌ی انویدیا بهره‌مندی از قابلیت فنی MIG است. به‌لطف MIG، پردازنده‌ی A100 به هفت قسمت تقسیم می‌شود تا بتواند برای اهداف مختلف، قدرت پردازشی متنوعی را ارائه دهد. بدین ترتیب A100 می‌تواند تشخیص دهد که برای انجام وظیفه‌ای خاص باید چه‌میزان قدرت رایانشی ارائه شود. MIG باعث می‌شود میزان بهینه‌سازی پردازنده به حداکثر برسد و بازده آن بالا رود. انویدیا از NVLink به‌عنوان ویژگی کلیدی چهارم پردازنده‌ی گرافیکی A100 یاد می‌کند. همچینن طبق گفته‌ی انویدیا ساخته‌شدن پردازنده‌ی جدید با اتکا بر تکنیک Structural Sparsity پنجمین ویژگی کلیدی آن است.

انویدیا پردازنده‌ی گرافیکی Ampere GA100 را در چندین مدل با مشخصات مختلف تولید می‌کند

دیگر مشخصات مهم پردازنده‌ی NVIDIA Ampere GA100 شامل بهره‌مندی آن از رابط حافظه‌ی ۶٬۱۴۴ بیت است که شامل حداکثر ۴۸ گیگابایت حافظه‌ی HBM2e در ۶ بسته‌ی HBM2 می‌شود؛ این بسته‌ها به‌صورت پراکنده در اطراف Die پردازنده‌ی گرافیکی جای گرفته‌اند. هر یک از بسته‌های موردبحث به‌ازای هر دای دارای ۲ گیگابایت حافظه‌ی گرافیکی (VRAM) هستند؛ بنابراین برای دستیابی به ۴۸ گیگابایت حافظه به بسته‌های 4Hi نیاز پیدا خواهید کرد. هر بسته‌ی 4Hi توانایی جای دادن ۸ گیگابایت حافظه را در خود دارد؛‌ بنابراین ۶ بسته‌ی 4Hi در کنار هم می‌توانند ۴۸ گیگابایت حافظه‌ی گرافیکی را ارائه دهند که عددی بسیار درخورتوجه است. ظاهرا حافظه‌ی پردازنده می‌تواند پهنای باند حدودا ۱/۶ ترابیت‌بر‌ثانیه را ارائه دهد.

پردازنده‌ی گرافیکی امپر انویدیا قرار است دارای چندین پیکربندی برای حافظه‌ی HBM باشد، بااین‌حال به‌طور کلی حافظه‌ی ارائه‌شده نهایتا ۴۸ گیگابایت خواهد بود؛ مگر اینکه انویدیا بخواهد در آینده پیکربندی‌های دیگری را با بسته‌های 6Hi یا حتی 8Hi ارائه دهد که به‌ترتیب می‌توانند سقف حافظه را به ۷۲ و ۹۶ گیگابایت ارتقاء دهند. پردازنده‌ی گرافیکی Tesla V100S انویدیا دوبرابر ظرفیت حافظه‌ی HBM بیشتر نسبت‌به Tesla V100 دارد و ظرفیت آن به ۳۲ گیگابایت می‌رسد. با درنظرگرفتن همین موضوع احتمال می‌دهیم انویدیا بخواهد چنین رویکردی را برای یکی دیگر از مدل‌های آینده‌ی Tesla A100 تکرار کند. 

تصویر زیر، طرح بلوک‌های پردازنده‌ی گرافیکی NVIDIA Ampere GA100 را نشان می‌دهد:

انویدیا امپر / Nvidia Ampere

برای مشاهده‌ی تصویر بالا در ابعاد اصلی روی آن کلیک کنید

به‌علاوه در تصویر زیر می‌توانید نظاره‌گر طرح بلوک‌های SM پردازنده‌ی NVIDIA Ampere GA100 باشید:

انویدیا امپر / Nvidia Ampere

برای مشاهده‌ی تصویر بالا در ابعاد اصلی روی آن کلیک کنید

پس از بررسی دقیق مشخصات فنی نسخه‌ی کامل پردازنده‌ی گرافیکی جدید انویدیا، بهتر است به بیان برخی نکات درمورد شتاب‌دهنده‌ی گرافیکی Tesla A100 نیز بپردازیم. Tesla A100 نسخه‌ی ضعیف‌تر Ampere GA100 به‌حساب می‌آید و به ۱۰۸ واحد SM مجهز شده است. این پردازنده‌ی گرافیکی ۶٬۹۱۲ هسته‌ی FP32 به‌همراه ۳٬۴۵۶ هسته‌ی FP64 و ۴۳۲ هسته‌ی تنسور دارد. طبق اطلاعات رسمی، Tesla A100 دارای رابط باس ۵٬۱۲۰ بیت است و حداکثر ظرفیت حافظه‌ی گرافیکی HBM2 آن به ۴۰ گیگابایت می‌رسد. این پردازنده‌ی گرافیکی از برخی جوانب جلب ‌توجه می‌کند. خصوصا به‌ این دلیل که استفاده از ۴۰ گیگابایت حافظه‌ی HBM2 به‌معنی استفاده از بسته‌های 5Hi خواهد بود که البته چنین اتفاقی دور از انتظار به‌نظر می‌رسد. به‌جای آن، احتمال می‌دهیم پردازنده‌ی موردبحث به بسته‌های 6Hi با تراشه‌ی DRAM ناقص روی هر بسته، مجهز شده باشد. 

NVIDIA Ampere Tesla A100 دارای توان طراحی حرارتی ۴۰۰ وات است

آن‌طور که انویدیا می‌گوید پردازنده‌ی NVIDIA Ampere Tesla A100 دارای توان طراحی حرارتی ۴۰۰ وات است؛ یعنی ۱۰۰ وات بیشتر از مدل Tesla V100 Mezzanine. مدل PCIe پردازنده از توان طراحی حرارتی ۳۰۰ وات استفاده می‌کند، بااین‌حال نسبت‌به مدل مزانین (Mezzanine) سرعت کلاک پایین‌تری دارد. مدل Mezzanine ازطریق سوئیچ‌های جدید NVLINK، دارای رابط GPU به GPU است. ازطرفی مدل PCIe را داریم که از سوئیچ ملناکس (Mellanox) به‌همراه دو رابط NVLINK نسل جدید و دو درگاه EDR استفاده می‌کند. 

در زمینه‌ی عملکرد پردازشی، NVIDIA Ampere GA100 قدرت یک Peta-OP را ارائه می‌دهد که به‌میزان ۲۰ برابر بیشتر از قدرت ارائه‌شده توسط Volta GV100 است. همچنین طبق گفته‌ی انویدیا پردازنده‌ی Ampere GA100 نسبت‌به Volta GV100 تا ۲٫۵ برابر عملکردی بهتر در زمینه‌ی پردازش فرمت نقطه شناور دقت دوگانه (Double-Precision Floating-Point Format) از خود برجای می‌گذارد که احتمالا به قدرت پردازشی حدودا ۱۹٫۵ ترافلاپس FP64 منتهی می‌شود؛ به‌خصوص با درنظرگرفتن این حقیقت که قدرت پردازشی پردازنده‌ی Volta به حدود ۸ ترافلاپس FP64 می‌رسد. این موضوع نشان می‌دهد که عملکرد پردازنده‌ی جدید در زمینه‌ی پردازش فرمت نقطه شناور دقت یگانه به حداکثر ۱۵۶ ترافلاپس FP32 می‌رسد که برای بازار محصولات HPC عددی دیوانه‌وار است.

پردازند‌ه‌ی Tesla V100 انویدیا که بر پایه‌ی پردازنده‌ی Ampere GA100 ساخته شده است قرار است در سیستم‌های DGX A100 و HGX A100 این شرکت مورداستفاده قرار گیرد. سیستم‌های DGX به‌صورت مطلق روی تحقیقات مبتنی‌بر هوش مصنوعی و همچنین پردازش‌های متنوع بازار HPC متکی هستند. از طرفی سیستم‌های HGX را داریم که طبق گفته‌ی انویدیا قدرت پردازشی خودشان را روی حوزه‌ی رایانش ابری (Cloud Computing) یا دیتاسنترها متمرکز می‌کنند. سیستم‌های موردبحث انویدیا با نام دقیق DGX-A100 و HGX-A100 شناخته می‌شوند و نسل سوم سیستم‌های DGX و HGX به‌حساب می‌آیند.

انویدیا امپر

شماری از شرکای تجاری انویدیا پیش‌تر به‌صورت رسمی اعلام کرده‌اند که قصد دارند در برخی سرورهای جدید خود از پردازنده‌های جدید انویدیا استفاده کنند؛ این سرورها در دسته‌ی سرورهای 1U و 2U و 4U و حتی حداکثر 10U جای می‌گیرند (توضیحات بیشتر درمورد واحدهای یادشده را در این‌جا بخوانید). براساس اطلاعات رسمی هر یک از این سرورها مجهزبه حداکثر ۸ تراشه‌ی Tesla A100 مبتنی‌بر Ampere GA100 هستند و از لاین‌های PCIe Gen 4.0 استفاده می‌کنند. 

جن‌سون هوانگ چند روز پیش در ویدئویی کوتاه به‌صورت مختصر‌به نسل بعدی سیستم DGX-A100 اشاره کرد که انویدیا به‌زودی به‌صورت کامل از آن پرده‌برداری می‌کند. ظاهرا نسل بعدی DGX-A100 خواهد توانست به‌لطف بهره‌مندی از ۸ پردازنده‌ی Tesla A100 حداکثر ۵ ترافلاپس قدرت پردازشی ارائه دهد. گفته می‌شود این سیستم به‌میزان ۲۰ برابر سریع‌تر از نسل پیش است که از پردازنده‌های مبتنی‌بر معماری Volta استفاده می‌کرد. سیستم مبتنی‌بر امپر DGX-A100 انویدیا از روز گذشته با قیمت پایه‌ی ۱۹۹٬۰۰۰ دلار روانه‌ی بازار شده است. 

شما کاربران زومیت چه دیدگاهی درمورد معماری امپر انویدیا دارید؟

مشخصات فنی کامل، بهترین قیمت کارت گرافیک انویدیا در فروشگاه‌های اینترنتی و مقایسه‌ی محصولات این شرکت با یکدیگر و کارت گرافیک های AMD را در بخش محصولات زومیت مشاهده کنید. محصولات متنوعی از سری‌‌ Geforce و محصولات حرفه‌ای Quadro در این بخش برای خرید و مقایسه در اختیار کاربران قرار گرفته است. 






ارسال نظر

عکس خوانده نمی‌شود
250