اینتل از دو پردازنده‌‌ی قدرتمند Gaudi2 و Greco برای هوش مصنوعی رونمایی کرد

{title limit=50}

تیم آزمایشگاه هابانای اینتل روز ۲۰ اردیبهشت در جریان رویداد هیبریدی Intel Vision دو محصول جدید و کلیدی خود را با نام‌های Gaudi2 و Greco برای شتاب‌ بخشیدن به فرایند‌های هوش مصنوعی و رقابت با انویدیا معرفی کرد. Gaudi2 دومین نسخه از پردازنده‌ی Gaudi است که هابانا قبلا برای تعلیم‌دهی یادگیری ماشین توسعه داده بود و درحال‌حاضر نیز در بازار به فروش می‌رسد و Greco نیز، جانشینی برای پردازنده‌ی استنباطی یادگیری ماشینی Goya است و از نیمه‌ی دوم ۲۰۲۲ به صورت گزینشی دراختیار برخی مشتریان قرار می‌گیرد. اینتل ادعا می‌کند که این دو پردازنده به‌طور قابل توجهی از پردازنده‌های نسل‌های قبلی و پردازنده‌های رقبا سریع‌تر هستند.

آزمایشگاه هابانا در سال ۲۰۱۶ با هدف توسعه‌ی پردازنده‌های هوش مصنوعی با کیفیتی بالا ایجاد شد؛ این آزمایشگاه تقریباً سه سال پس از راه‌اندازی به مبلغ ۲ میلیارد دلار توسط اینتل خریداری شد. این آزمایشگاه نسل اول پردازنده‌های Goya را در سال ۲۰۱۸ و نسل اول پردازنده‌های Gaudi را یک سال پس از آن و درست قبل از خرید اینتل، معرفی کرد.

مقایسه Gaudi2 با دیگر پردازنده‌های رقبا

Gaudi2 و Greco پردازنده‌های جدیدی از آزمایشگاه هابانا هستند که پس از خرید اینتل توسط اینتل عرضه شده و هردو با لیتوگرافی ۷ نانومتری تولید شده‌اند.

نسل اول پردازنده‌ی تعلیم‌دهی Gaudi با ۱۰ هسته‌ی پردازشی تنسور، حافظه‌‌‌ای ۳۲ گیگابایتی (HBM2) و رم ایستای (رم‌ی که با قطع شدن برق داده‌ها را حفظ نمی‌کند) ۲۴ مگابایتی عرضه شد، اما Gaudi2 از ۲۴ هسته‌ی تنسور بهره می‌برد، ظرفیت حافظه‌ی ذخیره‌سازی آن سه‌برابر شده و به ۹۶ گیگابایت (HBM2E) افزایش یافته و رم ایستای داخلی آن نیز دو برابر (۴۸ مگابایت) شده است. ایتان مدینه، مدیرعامل آزمایشگاه هابانا، ادعا می‌کند که Gaudi2 اولین و تنها شتاب‌دهنده‌ای است که به حافظه‌ی HBM2E مجهز است.

توان مصرفی این پردازنده‌ی هوش مصنوعی ۶۰۰ وات است که در مقایسه با توان مصرفی ۳۵۰ واتی Gaudi، مصرف بالایی محسوب می‌شود، بااین‌حال طبق گفته‌ی ایتان مدینه، Gaudi2 همچنان می‌تواند با خنک‌کننده‌ی غیرفعال پردازش کند و نیازی به استفاده از خنک‌کننده‌ی مایع ندارد.

اینتل برای به رخ کشیدن قدرت نسخه‌ی جدید پردازنده‌ی Gaudi2 چندین مقایسه بین این پردازنده و محصولات مشابه رقبا انجام داد. در این مقایسه‌ها، آموزش شبکه‌ی عصبی محبوب ResNet-50 (استاندارد طلایی سنجش عملکرد آموزش هوش مصنوعی)، با پردازنده‌ی Gaudi2 حدود ۳٫۲ برابر سریع‌تر از پردازنده‌ی Gaudi، حدود ۱٫۹ برابر سریع‌تر از پردازنده‌ی ۸۰ گیگابایتی A100 انویدیا و ۴٫۱ برابر سریع‌تر از پردازنده‌ی V100 این شرکت انجام شد. در بنچمارک‌های دیگر نیز اختلاف بین Gaudi2 و پردازنده‌ی ۸۰ گیگابایتی A100 به‌طور قابل‌توجهی بیشتر بود: آموزش شبکه‌ی عصبی BERT گوگل (برای درک بهتر پرس‌وجوها و متن کاربر) با پردازنده‌ی Gaudi2 حدود ۲٫۸ برابر سریع‌تر از پردازنده‌ی ۸۰ گیگابایتی A100 انویدیا صورت گرفت و ایتان مدینه نیز در توضیح این مقایسه گفت:

مقایسه‌ی Gaudi2 با V100 و A100 انویدیا از آن جهت حائز اهمیت است که هر دو در فضای ابری و داخلی کاربرد زیادی دارند.

کارت PCI Mezzanine یا PMC مجموعه برد مدار چاپی است که طبق استاندارد IEEE P1386.1 ساخته شده است. این استاندارد ویژگی‌های الکتریکی PCI را با ابعاد مکانیکی Common Mezzanine Card یا فرمت CMC (استاندارد IEEE 1386) ترکیب می‌کند.

پردازنده‌ی Gaudi2 در حال حاضر در قالب کارت Mezzanine یا قسمتی از سرور HLS-Gaudi2 برای مشتریان هابانا دردسترس است. سرور HLS-Gaudi2، سروری برای ارزیابی Gaudi2 بوده که از هشت کارت مجهز به Gaudi2 و یک ساب‌‌سیستم Xeon اینتل با دو سوکت تشکیل شده است. هابانا همچنین قصد دارد با همکاری Supermicro سروری آموزشی مجهز به پردازنده‌ی هوش مصنوعی Gaudi2 (به نام Supermicro X12 Gaudi2 Training Server) را در سه‌ماهه‌ی سوم ۲۰۲۲ عرضه کرده و نسخه‌ای از این سرور را با استفاده از فناوری DDN به حافظه‌ی متمرکز بر هوش مصنوعی مجهز کند.

علاوه‌براین، هزاران پردازنده‌ی Gaudi2 در حال حاضر در مراکز داده‌ی هابانا قرار دارند که برای بهینه‌سازی نرم‌افزارها و توسعه‌ی نسخه‌ی بعدی این پردزانده‌ی تعلیم‌دهی مورد استفاده قرار می‌گیرند.

در مورد پردازنده‌ی Greco نیز، آزمایشگاه هابانا آن را از حالت دو اسلات به حالت تک اسلات تبدیل کرد و توان مصرفی آن را از ۲۰۰ وات به ۷۵ وات کاهش داد. ایتان مدینه درباره‌ی این پردازنده‌ی استنباطی افزود:

به دلیل فرم فشرده‌ Greco، کاربران می‌توانند تعداد شتاب‌دهنده‌ها را در همان سیستم میزبان دو برابر کنند.

بااین‌حال تیم آبی، هنوز اطلاعات بیشتری درباره‌ی این پردازنده‌ به اشتراک نگذاشته است.

تست Gaudi2 برای آموزش هوش مصنوعی

Gaudi2 و Greco جدیدترین محصولات اینتل برای رقابت در دنیای شتاب‌دهنده‌های هوش مصنوعی هستند که نه‌تنها در پردازنده‌های گرافیکی انویدیا، بلکه در شتاب‌دهنده‌های تخصصی دیگری مانند Cerebras، Graphcore و SambaNova نیز استفاده می‌شوند. البته مقایسه‌هایی که اینتل با این دو پردازنده و محصولات مشابه انویدیا انجام داده، مقایسه با پردازنده‌ی گرافیکی H100 انویدیا را شامل نمی‌شوند؛ پردازنده‌ی گرافیکی H100 انویدیا به ۸۰ میلیارد ترانزیستور مجهز است که قرار است سرعتی بالاتر از A100 را به ارمغان آورند.

به گفته ساندرا ریورا، معاون اجرایی و مدیر گروه دیتاسنتر و هوش مصنوعی اینتل، پردازنده‌های جدید هابانا نمونه‌ی برجسته‌ای از دستاوردهای هوش مصنوعی اینتل در ارائه‌ی راهکارهای مناسب برای پاسخ به تعداد فزاینده و ماهیت پیچیده‌ی کارهای مبتنی بر هوش مصنوعی هستند.

دستاورد‌های پردازنده‌ی Gaudi2:

بهره‌وری تعلیم‌دهی یادگیری ماشینی:

پردازنده‌ی Gaudi2 هابانا، براساس همان معماری نسل اول Gaudi با کارایی بالا توسعه داده شده است و عملکرد آموزشی فضای ابری را در سرورهای خدمات تحت وب آمازون (AWS) تا ۴۰ درصد بهبود می‌بخشد. تغییر فرایند تولید پردازنده‌ی Gaudi2 از ۱۶ نانومتر به ۷ نانومتر، جهش قابل‌توجهی در قابلیت‌های محاسباتی، حافظه و شبکه را نوید می‌دهد. این پردازنده‌ی هوش مصنوعی به موتور پردازش رسانه‌ی داخلی نیز مجهز است که برای فشرده‌سازی رسانه و تخلیه‌ی سیستم میزبان به‌کار می‌رود. در Gaudi2 ظرفیت حافظه‌ی HBM2E با پهنای باند ۲٫۴۵ ترابایت‌بر‌ثانیه از ۳۲ گیگابایت به ۹۶ گیگابایت افزایش داده شده و ۲۴ کارت داخلی ۱۰۰ گیگابیتی برای افزایش و کاهش مقیاس اترنت استاندارد در نظر گرفته شده است.

مزایا برای مشتریان:

پردازنده‌ی Gaudi2 در مقایسه با شتاب‌دهنده‌های سنتی مبتنی بر پردازنده‌های گرافیکی، امکان تعلیم‌دهی کارآمدتری و به‌صرفه‌تری را برای مشتریان فراهم می‌کند. کاهش زمان مورد نیاز برای تعلیم‌دهی در Gaudi2، می‌تواند با ارائه‌ی دیدگاه‌ها ومدل‌سازی بهتر، زمان ورود به بازار را تسریع کرده و به کسب‌وکارها رونق بخشد. درواقع می‌توان گفت که Gaudi2 با هدف بهبود مدل‌سازی بینایی برای استفاده در وسایل نقلیه‌ی خودران، تصویربرداری پزشکی، شناسایی نقص‌های تولید و پردازش زبان طبیعی، توسعه داده شده است.

افزایش ظرفیت شبکه، انعطاف‌پذیری و کارایی:

هابانا با افزایش پهنای باند قابلیت آموزش در نسل دوم Gaudi، هزینه‌های فرایند آموزشی را کاهش داده است. به لطف یکپارچه‌سازی استاندارد صنعتی RoCE روی این تراشه و انحصارزدایی اینتل، مشتریان به‌راحتی می‌توانند این پردازنده‌ را متناسب با نیازهای خود، مقیاس‌بندی کرده و با پیاده‌سازی گسترده‌ی سیستم روی اتصال اترنت استاندارد صنعتی، هزینه‌ی کمتری بپردازند.

ساده‌سازی و ارتقای نسخه‌ی جدید:

هابانا مجموعه نرم‌افزاری ®SynapseAI را برای توسعه‌ی مدل‌های یادگیری عمیق و انتقال مدل‌های مبتنی بر گرافیک‌های موجود به سخت‌افزار پلتفرم Gaudi طراحی کرده است. این نرم‌افزار ابتدا امکان آموزش مدل‌ها را به کمک پردازنده‌ی Gaudi2 فراهم می‌کند و کاربر پس از آن می‌تواند این مدل آموزش‌یافته را در پردازنده‌های Xeon اینتل یا Greco استنباط کند.

دردسترس بودن راه‌حل‌های آموزشی:

هابانا ازطریق وب‌سایت مخصوص توسعه‌دهندگان اسناد و ابزارهای لازم برای توسعه‌ی پیشرفته‌تر کرنل‌ها دراختیار مشتریان قرار می‌دهد و مشتریان می‌توانند پس از خرید پردازنده‌‌ی Gaudi2 از افزایش ظرفیت ذخیره‌سازی هوش مصنوعی و راه‌حل‌های ذخیره‌سازی بهره‌مند شوند.






ارسال نظر

عکس خوانده نمی‌شود
13