پردازنده مرکزی Nvidia Grace بر پایه ARM معرفی شد؛ ۱۰ برابر قوی‌تر از x86

{title limit=50}

انویدیا شب گذشته در جریان برگزاری GTC 2021 معماری متکی ‌بر آرم گریس (Nvidia Grace) را برای پردازنده‌های مرکزی کلاس دیتاسنتر معرفی و ادعا کرد این معماری ۱۰ برابر سرعت بیشتر نسبت ‌به پرسرعت‌ترین سرورهای امروزی در حوزه‌ی هوش مصنوعی و رایانش با قدرت بالا دارد.

پردازنده‌های مرکزی اختصاصی انویدیا به‌زودی در نقش قلب تپنده‌ی دو ابرکامپیوتر هوش مصنوعی ظاهر می‌شوند و از هسته‌های نسل بعد Neoverse آرم که جزئیات دقیقشان را فعلا نمی‌دانیم استفاده می‌کنند. این تراشه‌ها در ابرکامپیوترهای یادشده در کنار حافظه‌ی رم LPDDR5x قرار می‌گیرند که ۵۰۰ گیگابایت‌ بر ثانیه توان عملیاتی ارائه می‌دهد. ابرکامپیوترها از اتصال ۹۰۰ گیگابایت ‌بر ثانیه‌ایِ NVLink به کارت گرافیکی نامشخص بهره می‌برند تا قدرت پردازشی زیادی ارائه بدهند.

آن‌طور که تامز هاردور می‌نویسد، انویدیا از نقشه‌ی راه جدید خود نیز که پردازنده‌ی مرکزی بعد از معماری گریس (Grace Next) را برای سال ۲۰۲۵ نشان می‌دهد پرده‌برداری کرده است. تیم سبز می‌گوید معماری گرافیکی «Ampere Next Next» در اواسط سال ۲۰۲۴ از راه خواهد ‌رسید.

معماری گریس انویدیا فعلا مختص‌ پردازنده‌های مرکزی کلاس دیتاسنتر است

تصاحب آرم توسط انویدیا که هنوز به‌طور کامل انجام نشده و منتظر دریافت چراغ سبز از نهادهای بزرگ تنظیم مقررات در سراسر دنیا است، باعث شد بسیاری از تحلیلگران تخمین بزنند که انویدیا سراغ تولید پردازنده‌ی مرکزی متکی ‌بر معماری آرم می‌رود. جن سون هوانگ، مدیرعامل انویدیا، پیش‌تر تأیید کرده بود که احتمال تولید پردازنده‌ی مرکزی انویدیا وجود دارد.

اولین نسل معماری پردازشی گریس در قالب پردازنده‌های مرکزی کلاس دسکتاپ و لپ‌تاپ ارائه نمی‌شود؛ اما به‌وضوح مشخص است تیم سبز اهداف بزرگی برای پردازنده‌های کلاس دیتاسنتر گریس در سر می‌پروراند. 

انویدیا فعلا تعداد هسته و سرعت کلاک پردازنده‌های گریس را اعلام نکرده است که البته اتفاق تعجب‌برانگیزی محسوب نمی‌شود؛ چون بنا بر اطلاعات رسمی، پردازنده‌های دیتاسنتر گریس تا اوایل سال ۲۰۲۳ به بازار عرضه نخواهند شد. البته انویدیا مشخصا گفته است پردازنده‌های یادشده از هسته‌های نسل بعد Neoverse آرم استفاده می‌کنند.

با درنظرگرفتن آنچه درباره‌ی نقشه‌ی راه عمومی فعلی آرم می‌دانیم، احتمال می‌دهیم هسته‌ای که انویدیا به آن اشاره می‌کند، پلتفرم V1 موسوم به Zeus باشد. هسته‌های Zeus برای دستیابی به بیشترین قدرت پردازشی بهینه شده‌اند و به همین دلیل تمام ناحیه‌ی دای (Die) را در بر می‌گیرند و مصرف انرژی بالایی دارند. 

جزئیات معماری Neoverse آرم

پردازنده‌های مبتنی ‌بر هسته‌های Zeus ممکن است در مدل‌های هفت و پنج نانومتری تولید شوند و در مقایسه ‌با هسته‌های فعلی N1 آرم، تا ۵۰ درصد دستورالعمل بر سیکل کلاک (IPC) بیشتر ارائه بدهند. پلتفرم V1 آرم از تمام فناوری‌های جدید مثل PCIe 5.0 و DDR5 و حتی HBM2e یا HBM3 به‌ همراه اینترکانکت CCIX 1.1 پشتیبانی می‌کند. به ‌نظر می‌رسد انویدیا حداقل فعلا برای متصل کردن پردازنده‌ی مرکزی و پردازنده‌ی گرافیکی خود، به ‌جای CCIX سراغ NVLink اختصاصی می‌رود.

انویدیا می‌گوید پردازنده‌ی مرکزی گریس خواهد توانست امتیاز بالای ۳۰۰ در بنچمارک SPECrate_2017_int_base کسب کند و این یعنی قدرت پردازشی زیادی دارد. تیم سبز ادعا می‌کند با هشت پردازنده‌ی گرافیکی در یک سیستم DGX، سیستم می‌تواند به امتیاز فوق‌العاده‌ی ۲۴۰۰ در بنچمارک SPECrate_2017_int_base دست پیدا کند. نسل فعلی DGX در بهترین حالت امتیاز ۴۵۰ کسب می‌کند و این یعنی قرار است شاهد تفاوت‌های محسوسی باشیم.

AMD EPYC Milan که جدیدترین پردازنده‌های تیم قرمز برای دیتاسنتر محسوب می‌شوند و قدرت پردازشی بسیار زیادی دارند، دارای امتیاز SPEC بین ۳۸۲ تا ۴۲۴ هستند و همین موضوع باعث می‌شود پردازنده‌‌ی مرکزی گریس بیشتر در نقش رقیبی برای پردازنده‌های دیتاسنتر نسل قبل ۶۴ هسته‌ای AMD یعنی سری Rome ظاهر شود. به ‌نظر می‌رسد ادعای انویدیا مبنی‌ بر ۱۰ برابر شدن قدرت پردازشی پلتفرم جدیدش نسبت ‌به سرورهای نسل فعلی، به پردازش گرافیکی مرتبط باشد. 

انویدیا می‌گوید نخستین مدل‌های پردازنده‌ی مرکزی گریس در قالب پکیج BGA در دسترس قرار می‌گیرند و این یعنی برخلاف پردازنده‌های مرسوم x86، تراشه‌های سوکت‌دار نخواهند بود. به ‌نظر می‌رسد اولین پردازنده‌های گریس به ‌همراه هشت بسته حافظه‌ی LPDDR5x در دسترس قرار می‌گیرند. انویدیا می‌گوید حافظه‌ی LPDDR5x ECC در مقایسه‌ با ساب‌سیستم استاندارد حافظه‌ی DDR4 دو برابر پهنای باند بیشتر و ۱۰ برابر مصرف انرژی کمتر دارد.

نسل بعد NVLink انویدیا که فعلا جزئیات زیادی درباره‌ی آن نمی‌دانیم، تراشه را به پردازنده‌ی مرکزی مجاور با نرخ انتقال ۹۰۰ گیگابایت ‌بر ثانیه (۱۴ برابر سریع‌تر) متصل می‌کند. بررسی‌ها نشان می‌دهد سرعت نسل بعد NVLink انویدیا ۳۰ برابر سریع‌تر از سیستم‌های ارتباطی بین پردازنده‌ی مرکزی و پردازنده‌ی گرافیکی سرور در دنیای امروز است. انویدیا همچنین می‌گوید نسل جدید NVLink می‌تواند اطلاعات را در بین پردازنده‌های مرکزی با سرعت دو برابر بیشتر از سیستم‌های مرسوم انتقال بدهد.

نحوه پردازش داده در معماری پردازشی گریس انویدیا / Nvidia Grace اسلاید رسمی

استفاده از NVLink باعث انسجام حافظه‌ی کش می‌شود و این یعنی حافظه‌ی سیستم و پردازنده‌ی گرافیکی (LPDDR5x و HBM) در فضای مشترکی قرار می‌گیرند تا برنامه‌نویسی ساده‌تر شود. انسجام کش همچنین باعث کاهش حرکت داده‌ها در بین پردازنده‌ی مرکزی و پردازنده‌ی گرافیکی می‌شود و قدرت پردازشی را بالا و مصرف انرژی را پایین می‌آورد.

این ترکیب باعث می‌شود انویدیا از لحاظ تئوری بتواند قابلیتی مثل سیستم‌هایی که دارای پردازنده‌ی مرکزی EPYC و پردازنده‌ی گرافیکی Radeon Instinct هستند ارائه بدهد. اینتل نیز ترکیب مشابهی با پردازنده‌ی مرکزی Sapphire Rapids و پردازنده‌ی گرافیکی Ponte Vecchio در ابرکامپیوتر Aurora دارد. انویدیا می‌گوید استفاده از پردازنده‌ی مرکزی و پردازنده‌ی گرافیکی اختصاصی در ابرکامپیوتر ۲٫۸ اگزافلاپسی Selene، زمان مورد نیاز برای تعلیم GPT-3 (بزرگ‌ترین مدل هوش مصنوعی زبان طبیعی در دنیا) را از ۱۴ روز به دو روز کاهش می‌دهد.

اسلاید معماری گرافیکی Ampere Next انویدیا در مراسم GTC 2021

انویدیا همچنین از نقشه‌ی راهی رونمایی کرد تا روند منظم ارتقاء قطعات خود را در سال‌های پیش رو به ‌نمایش بگذارد. انویدیا می‌گوید در سال‌های آینده با نرخی به‌نسبت ثابت، مدل جدید پردازنده‌های گرافیکی، پردازنده‌های مرکزی (آرم و x86) و واحد پردازش داده (DPU) خود را معرفی می‌کند.

پردازنده‌های دیتاسنتر Nvidia Grace تا اوایل سال ۲۰۲۳ به بازار عرضه نمی‌شوند

طبق گفته‌ی جن سون هوانگ، انویدیا هر دو سال یک ‌بار هر یک از معماری‌های پردازشی خود را پیشرفته‌تر می‌کند؛ با این توضیح که معماری x86 در یک سال پیشرفته‌تر می‌شود و سال بعد نوبت بهبود آرم می‌رسد؛ انویدیا می‌گوید احتمالا در بین آن‌ها بهبودهای دیگری هم اعمال می‌کند و شاید این بهبودها به‌ جای معماری به فناوری پردازشی مربوط باشند.

نکته‌ی جالب این است که انویدیا برای انتخاب نام پردازنده‌ی مرکزی گریس از نام گریس هاپر (دانشمند معروف حوزه‌ی کامپیوتر) استفاده کرده است. طبق شایعه‌ها، انویدیا از مدت‌ها پیش کار روی پردازنده‌های گرافیکی هاپر را که متکی‌ بر طراحی چیپلت هستند آغاز کرده. هماهنگی جالبی در نام پردازنده‌های مرکزی و گرافیکی جدید تیم سبز به‌ چشم می‌خورد. 

آزمایشگاه ملی لس آلاموس وزارت انرژی ایالات متحده در روز پرچم آمریکا

انویدیا می‌گوید آزمایشگاه ملی لس آلاموس که متعلق ‌به وزارت انرژی ایالات متحده است، به‌زودی ابرکامپیوتری با پردازنده‌ی گریس تولید می‌کند. این سیستم توسط HPE ساخته می‌شود و در سال ۲۰۲۳ به مرحله‌ی عملیاتی می‌رسد. وزارت انرژی آمریکا فعلا جزئیات زیادی درباره‌ی ابرکامپیوتر جدیدش منتشر نکرده است.

انویدیا می‌گوید پردازنده‌ی مرکزی گریس در قوی‌ترین ابرکامپیوتر هوش مصنوعی دنیا با نام Alps قرار می‌گیرد؛ سیستم Alps در مرکز ملی رایانش سوئیس واقع می‌شود و به دانشمندان و محققان اروپایی کمک می‌کند. ابرکامپیوتر Alps که در ۲۰۲۳ آنلاین می‌شود، در حوزه‌هایی مثل آب‌و‌هوا، دینامیک مولکولی، دینامیک سیالات محاسباتی و موارد این‌چنینی به کار خواهد آمد. 






ارسال نظر

عکس خوانده نمی‌شود
963