اینتل پردازنده گرافیکی Xe HP با قدرتی در مقیاس پتافلاپس را بهنمایش گذاشت
راجا کودوری، معمار ارشد اینتل و رئیس واحد تجاری کارت گرافیک مجزا در این شرکت که سال ۲۰۱۷ از AMD جدا شد، طی چند ماه اخیر در مراسمهای مختلف حضور پیدا کرده و جزئیاتی جدید دربارهی معماری جدید پردازندههای گرافیکی اینتل یعنی معماری Xe و محصولاتی که برپایهی آن ساخته میشوند با رسانهها در میان گذاشته است. پردازندههای گرافیکی خانوادهی Xe تنوع بالایی از محصولات را شامل میشوند؛ از پردازندههای گرافیکی کممصرف مجتمع و پایینرده تحت نام Xe LP Graphics گرفته تا پردازندههای گرافیکی مخصوص دیتاسنترها که عموما متشکلاز چندین تراشه هستند. کودوری بهتازگی جزئیاتی جدید دربارهی پردازندههای گرافیکی دستهی دوم دردسترس رسانهها قرار داده است.
همانطور که هفتهی گذشته اعلام شد، پردازندههای گرافیکی سری Xe HP اینتل قرار است در سه نوع روانهی بازار شوند. مدل پایه که تاکنون چند بار در اخبار رسمی ظاهر شده است از یک کاشی (Tile) بهره میگیرد که شامل ۵۱۲ واحد اجرایی (EU) و بهاحتمال زیاد دو بستهی HMB2e خواهد بود. اینتل هنوز مشخصات فنی رسمی این پردازندهی گرافیکی را تأیید نکرده، اما بهتازگی نحوهی عملکرد پردازندههای گرافیکی خانوادهی Xe که شامل یک، دو یا چهار کاشی هستند را بهنمایش گذاشته است که جزئیات را میتوانید در تصویر زیر مشاهده کنید:
برای مشاهدهی تصویر بالا در ابعاد اصلی روی آن کلیک کنید
قدرت پردازشی بیشتری که حضور کاشیهای اضافه بههمراه میآورد در نگاه اول فوقالعاده است؛ بااینحال نباید فراموش کنید نتایج حاضر در تصویر بالا مربوط به انجام وظایف گرافیکی آنی (Real-Time) نیستند. تقسیم کار بین پردازندههای گرافیکی بهمنظور دستیابی به فناوریهایی نظیر SLI و CrossFire کار بسیار سختتری است و استفاده از پردازنده گرافیکی اضافی در بهترین حالت ممکن، عملکرد اجرای بازیهای ویدئویی را بین ۵۰ تا ۸۰ درصد بهبود میبخشد. برای اهداف غیرگرافیکی که بیشتر روی توان پردازشی متمرکز هستند، کارها بهطور معمول بهطور مجزا انجام میشوند.
در ابتدا تصور میشد که پردازندهی گرافیکی متشکلاز چهار کاشی وجود خارجی ندارد و بیشتر بازی تبلیغاتی اینتل است؛ اما راجا کودوری در جریان برگزاری رویداد Hot Chips اینتل، پردازندهی موردبحث را که ابعاد بسیار بزرگی داشت رو به دوربین نشان داد تا ثابت کند اینتل واقعا در حال ساخت پردازندهی گرافیکی بسیار ردهبالا و قدرتمندی است.
پردازندهی متشکلاز چهار کاشی اینتل واقعا ابعاد بزرگی دارد؛ بزرگتر از تمامی تراشههایی که تاکنون دیده بودیم. اینکه پردازندهی گرافیکی موردبحث سری Xe HP وارد مرحلهی تولید نهایی میشود یا نه، سؤالی است که فعلا پاسخش را با اطمینان نمیدانیم. فراموش نکنید اینتل پردازندهی گرافیکی Xe HPC ملقببه پونته وکیو (Ponte Vecchio) را هم دارد و طی چند وقت اخیر بهشکلی ویژه روی آن مانور داده است.
برای مشاهدهی تصویر بالا در ابعاد اصلی روی آن کلیک کنید
پردازندهی گرافیکی Xe HP برای تبدیلشدن به پردازندهای با چند کاشی از EMIB استفاده میکند. آنطور که اینتل در اطلاعیهای رسمی اعلام کرده، پردازندهی گرافیکی Xe HPC قرار است شامل یک کاشی با نام رمبو کش (Rambo Cache) باشد، از فناوری پکیجینگ Foveros استفاده کند و با بهرهگیری از Co-EMIB بهبودهای بیشتری در زمینهی پردازشی ارائه دهد.
اینتل میگوید کاشی پایهی پردازندهی پونته وکیو با استفاده از لیتوگرافی جدید ۱۰ نانومتری سوپرفین (SuperFin) ساخته میشود که نسخهی بهبودیافتهی فینفت (FinFET) بهحساب میآید. کاشی رمبو کش از لیتوگرافی «بهبودیافتهی» سوپرفین که جزئيات کاملش را دردسترس نداریم استفاده میکند. هنوز لیتوگرافی کاشی Xe Link I/O مشخص نشده، اما اینتل گفته که این کاشی توسط شرکتی خارجی تولید میشود. درنهایت آنطور که تیم آبی میگوید، برای تولید کاشی اصلی یعنی کاشی پردازشی، از دو نوع لیتوگرافی بهره گرفته خواهد شد که در نوع خود اتفاق عجیبی است.
اینتل بهصورت رسمی اعلام میکند که در آزمایشگاههایش درحال کار روی پردازندههایی از خانوادهی Xe HP با یک، دو و چهار کاشی است. استفاده از EMIB بدین معنی است که دو پردازندهی گرافیکی آخر بهترتیب دو و چهار برابر پردازندهی پایه ابعاد دارند؛ بنابراین لازم است در آنها از سه سوکت مجزا استفاده شود.
برای مشاهدهی تصویر بالا در ابعاد اصلی روی آن کلیک کنید
پردازندهی گرافیکی چهار کاشی Xe HP که راجا کودروی در جلوی دوربین نشانش داد ظاهرا میتواند به ۴۲ ترافلاپس قدرت پردازشی FP32 دست پیدا کند؛ البته این عدد، حداکثر توانایی پردازندهی گرافیکی اینتل نیست. کودوری در بخشی از سخنان خود مدعی شد این پردازندهی گرافیکی قدرتمند میتواند به قدرت پردازشی در مقایس پتافلاپس دسترسی پیدا کند (بهعبارتی دیگر، بیش از ۱٬۰۰۰ ترافلاپس). دستیابی به این هدف بهلطف حضور هستههای تنسور (Tensor) ممکن میشود؛ البته فعلا پیکربندی دقیق هستهها را در پردازندهی گرافیکی اینتل نمیدانیم.
مقالههای مرتبط:
همچون معماری A100 انویدیا و معماری TPUv4 گوگل، Xe HP از هستههای تنسور پشتیبانی میکند. هنوز اطلاعاتی دقیق اعلام نشده اما حدس میزنیم این هستهها میتوانند بهازای هر سیکل، ۱۲۸ عملیات انجام دهند؛ بهعبارتی، پردازندهی گرافیکی اینتل بهازای واحد اجرایی شامل یک هستهی تنسور خواهد بود. این یعنی اگر ۲٬۰۴۸ واحد اجرایی داشته باشیم، با حل کردن این معادله «۲۰۴۸x۱۲۸x۲» به جواب «۵۲۴٬۲۸۸» میرسیم. البته در اینجا سرعت کلاک را لحاظ نکردهایم. انتظار داریم برای یک پتافلاپس شاهد دستیابی به سرعت کلاک دو گیگاهرتز باشیم. شاید اینتل نوع دیگری از هستههای تنسور را استفاده کند که بتوانند بهازای هر سیکل، بیش از ۱۲۸ عملیات انجام دهند. در هر صورت بهلطف چنین پردازندهی توانمندی، ابررایانهها سادهتر میتوانند به قدرت پردازشی بسیار بالا دسترسی پیدا کنند.