پردازنده گرافیکی A100 انویدیا با ۸۰ گیگابایت حافظه معرفی شد
تنها ۶ ماه از رونمایی اولیهی معماری امپر انویدیا (Nvidia Ampere) میگذرد و تیم سبز بهتازگی تصمیم گرفته است پرچمدار جدیدی برای این خانواده از تراشههای گرافیکی معرفی کند. جدیدترین مدل از تراشههای گرافیکی امپر مدل بهبودیافتهی پرچمدار پیشین محسوب میشود و حافظهی گرافیکی (VRAM) بیشتر دارد و پهنای باندش بهطور درخورتوجهی افزایش پیدا کرده است.
مدل جدید تراشهی A100 امپر این بار ۸۰ گیگابایت حافظهی گرافیکی دارد و از بسیاری از جوانب درمقایسهبا مدل ۴۰ گیگابایتی بدون تغییر باقی مانده است. بدینترتیب A100 هشتادگیگابایتی همچون A100 چهلگیگابایتی از سرعت کلاک بوست (تقویتشده) ۱٫۴۱ گیگاهرتز، باس حافظهی ۵،۱۲۰ بیت، قدرت پردازشی دقت تکی ۱۹٫۵ ترافلاپس (TFLOPS) و توان طراحی حرارتی ۴۰۰ وات استفاده میکند و از NVLink 3 پشتیبانی میکند. هر دو تراشه به ۶،۱۹۲ هستهی گرافیکی مجهز هستند.
اصلیترین تفاوت بین تراشههای پرچمدار خانوادهی امپر، حداکثر حافظهی گرافیکی آنها است که در مدل جدید از ۴۰ گیگابایت به ۸۰ گیگابایت افزایش پیدا کرده است. مدل جدید مجموع پهنای باند حافظهی بیشتری نیز دارد. براساس اعلام رسمی، پهنای باند مدل ۸۰ گیگابایتی معادل ۳٫۲ گیگابیتبرثانیه HBMe است؛ درحالیکه مدل ۴۰ گیگابایت پهنای باند ۲٫۴ گیگابیتبرثانیهای HBMe ارائه میداد.
پهنای باند در سراسر آرایهی HBM2 دو ترابایتبرثانیه است؛ درحالیکه این مقدار در مدل ۴۰ گیگابایتی A100 معادل ۱٫۶ ترابایتبرثانیه بود. آنچه گفتیم، بهوضوح نشان میدهد مدل ۸۰ گیگابایتی A100 بهبودهای محسوسی تجربه کرده است. اگر انویدیا بهمنظور دستیابی به دو برابر ظرفیت بیشتر پهنای باند حافظهی آرایهی HBM2 را کاهش میداد، بههیچوجه تعجب نمیکردیم. بااینحال، تیم سبز ترجیح داده است مجموع پهنای باند را نیز ۱٫۲۵ برابر افزایش دهد.
همانطورکه در تصویر بالا مشاهده میکنید، تراشهی جدید A100 از ۶ بستهی HBM2 تشکیل شده است. باوجوداین، انویدیا یکی از این بستهها را غیرفعال کرده تا بازدهی نهایی تراشه بهبود یابد. هریک از پنج بستهی باقیمانده باس حافظهی ۱،۰۲۴ بیتی دارند و همین موضوع باعث شده مجموع باس حافظهی تراشه برابر با ۵،۱۲۰ بیت باشد.
انویدیا در مدل ۸۰ گیگابایتی تراشهی A100 از بستهی HBM2E بهجای HBM2 استفاده کرده است تا بتواند مشخصههای پایهای تراشه را بهطور اساسی ارتقا دهد. مدل ۸۰ گیگابایت تراشهی A100 انویدیا مخصوص آن دسته از وظایف کاری است که به ظرفیت و پهنای باند بیشتر نیاز دارند.
مقالهی مرتبط:
مدل ۸۰ گیگابایتی همچون مدل ۴۰ گیگابایتی میتواند حداکثر از هفت دستگاه پشتیبانی کند و به هریک از آنها ۱۰ گیگابایت حافظهی گرافیکی اختصاص دهد. انویدیا قصد دارد پردازندهی گرافیکی جدید خود را در قالب کارتهای گرافیک تکی Mezzanine Modular و با پیکربندی HGX یا DGX عرضه کند.
علاقهمندان به خرید پردازندهی گرافیکی A100 را در قالب کارت گرافیک PCIe همچنان باید به مدل ۴۰ گیگابایتی فکر کنند؛ زیرا انویدیا فعلا مدل ۸۰ گیگابایتی را در کارتهای PCIe قرار نداده است. بااینحال احتمالا این وضعیت در آینده دستخوش تغییر میشود.
مقایسهی تراشههای گرافیکی ردهبالای انویدیا | |||
---|---|---|---|
- | (A100 (80GB | (A100 (40GB | V100 |
هستههای کودای FP32 | ۶،۹۱۲ | ۶،۹۱۲ | ۵،۱۲۰ |
سرعت کلاک بوست | ۱،۴۱۰ مگاهرتز | ۱،۴۱۰ مگاهرتز | ۱،۵۳۰ مگاهرتز |
سرعت کلاک حافظه | ۳٫۲ گیگابیتبرثانیه HBM2e | ۲٫۴ گیگابیتبرثانیه HBM2 | ۱٫۷۵ گیگابیتبرثانیه HBM2 |
پهنای باس حافظه | ۵،۱۲۰ بیت | ۵،۱۲۰ بیت | ۴،۰۹۶ بیت |
پهنای باند حافظه | ۲٫۰ ترابایتبرثانیه | ۱٫۶ ترابایتبرثانیه | ۹۰۰ گیگابایتبرثانیه |
حافظهی گرافیکی | ۸۰ گیگابایت | ۴۰ گیگابایت | ۱۶ یا ۳۲ گیگابایت |
قدرت پردازشی دقت یگانه | ۱۹٫۵ ترافلاپس | ۱۹٫۵ ترافلاپس | ۱۵٫۷ ترافلاپس |
قدرت پردازشی دقت دوگانه | ۹٫۷ ترافلاپس (یکدوم نرخ FP32) | ۹٫۷ ترافلاپس (یکدوم نرخ FP32) | ۷٫۸ ترافلاپس (یکدوم نرخ FP32) |
تنسور INT8 | ۶۲۴ تاپس | ۶۲۴ تاپس | نامشخص |
تنسور FP16 | ۳۱۲ ترافلاپس | ۳۱۲ ترافلاپس | ۱۲۵ ترافلاپس |
تنسور TF32 | ۱۵۶ ترافلاپس | ۱۵۶ ترافلاپس | نامشخص |
اینترکانکت | NVLink 3 ۱۲ لینک (۶۰۰ گیگابایتبرثانیه) | NVLink 3 ۱۲ لینک (۶۰۰ گیگابایتبرثانیه) | NVLink 2 ۶ لینک (۳۰۰ گیگابایتبرثانیه) |
پردازندهی گرافیکی | GA100 با مساحت ۸۲۵ میلیمترمربع | GA100 با مساحت ۸۲۶ میلیمترمربع | GV100 با مساحت ۸۱۵ میلیمترمربع |
تعداد ترانزیستور | ۵۴٫۲ میلیارد | ۵۴٫۲ میلیارد | ۲۱٫۱ میلیارد |
توان طراحی حرارتی | ۴۰۰ وات | ۴۰۰ وات | ۳۰۰ یا ۳۵۰ وات |
لیتوگرافی | ۷ نانومتری TSMC | ۷ نانومتری TSMC | ۱۲ نانومتری TSMC |
رابط | SXM4 | SXM4 | SXM2 یا SXM3 |
معماری | امپر (Ampere) | امپر (Ampere) | ولتا (Volta) |
برچسب قیمت سرور پر از پردازندههای گرافیکی ۸۰ گیگابایتی A100 انویدیا بسیار گران خواهد بود. بااینحال، شرکتهایی که بهطور جدی مشغول کار روی هوش مصنوعی و پردازشهای سنگین مرتبط به آن هستند، بهاحتمال زیاد درصورت داشتن منابع مالی کافی، حاضر خواهند بود هزینههای هنگفتی برای تهیهی سرورهای حاوی پردازندهی گرافیکی جدید انویدیا بپردازند. افزایش حافظهی گرافیکی تراشهی A100 به محققان امکان میدهد پیچیدگی مدلهای هوش مصنوعی خود را افزایش دهند و مشکلاتی را برطرف کنند که مدل ۴۰ گیگابایتی با آنها مواجه بود.