اینتل از دو پردازندهی قدرتمند Gaudi2 و Greco برای هوش مصنوعی رونمایی کرد
تیم آزمایشگاه هابانای اینتل روز ۲۰ اردیبهشت در جریان رویداد هیبریدی Intel Vision دو محصول جدید و کلیدی خود را با نامهای Gaudi2 و Greco برای شتاب بخشیدن به فرایندهای هوش مصنوعی و رقابت با انویدیا معرفی کرد. Gaudi2 دومین نسخه از پردازندهی Gaudi است که هابانا قبلا برای تعلیمدهی یادگیری ماشین توسعه داده بود و درحالحاضر نیز در بازار به فروش میرسد و Greco نیز، جانشینی برای پردازندهی استنباطی یادگیری ماشینی Goya است و از نیمهی دوم ۲۰۲۲ به صورت گزینشی دراختیار برخی مشتریان قرار میگیرد. اینتل ادعا میکند که این دو پردازنده بهطور قابل توجهی از پردازندههای نسلهای قبلی و پردازندههای رقبا سریعتر هستند.
آزمایشگاه هابانا در سال ۲۰۱۶ با هدف توسعهی پردازندههای هوش مصنوعی با کیفیتی بالا ایجاد شد؛ این آزمایشگاه تقریباً سه سال پس از راهاندازی به مبلغ ۲ میلیارد دلار توسط اینتل خریداری شد. این آزمایشگاه نسل اول پردازندههای Goya را در سال ۲۰۱۸ و نسل اول پردازندههای Gaudi را یک سال پس از آن و درست قبل از خرید اینتل، معرفی کرد.
Gaudi2 و Greco پردازندههای جدیدی از آزمایشگاه هابانا هستند که پس از خرید اینتل توسط اینتل عرضه شده و هردو با لیتوگرافی ۷ نانومتری تولید شدهاند.
نسل اول پردازندهی تعلیمدهی Gaudi با ۱۰ هستهی پردازشی تنسور، حافظهای ۳۲ گیگابایتی (HBM2) و رم ایستای (رمی که با قطع شدن برق دادهها را حفظ نمیکند) ۲۴ مگابایتی عرضه شد، اما Gaudi2 از ۲۴ هستهی تنسور بهره میبرد، ظرفیت حافظهی ذخیرهسازی آن سهبرابر شده و به ۹۶ گیگابایت (HBM2E) افزایش یافته و رم ایستای داخلی آن نیز دو برابر (۴۸ مگابایت) شده است. ایتان مدینه، مدیرعامل آزمایشگاه هابانا، ادعا میکند که Gaudi2 اولین و تنها شتابدهندهای است که به حافظهی HBM2E مجهز است.
توان مصرفی این پردازندهی هوش مصنوعی ۶۰۰ وات است که در مقایسه با توان مصرفی ۳۵۰ واتی Gaudi، مصرف بالایی محسوب میشود، بااینحال طبق گفتهی ایتان مدینه، Gaudi2 همچنان میتواند با خنککنندهی غیرفعال پردازش کند و نیازی به استفاده از خنککنندهی مایع ندارد.
اینتل برای به رخ کشیدن قدرت نسخهی جدید پردازندهی Gaudi2 چندین مقایسه بین این پردازنده و محصولات مشابه رقبا انجام داد. در این مقایسهها، آموزش شبکهی عصبی محبوب ResNet-50 (استاندارد طلایی سنجش عملکرد آموزش هوش مصنوعی)، با پردازندهی Gaudi2 حدود ۳٫۲ برابر سریعتر از پردازندهی Gaudi، حدود ۱٫۹ برابر سریعتر از پردازندهی ۸۰ گیگابایتی A100 انویدیا و ۴٫۱ برابر سریعتر از پردازندهی V100 این شرکت انجام شد. در بنچمارکهای دیگر نیز اختلاف بین Gaudi2 و پردازندهی ۸۰ گیگابایتی A100 بهطور قابلتوجهی بیشتر بود: آموزش شبکهی عصبی BERT گوگل (برای درک بهتر پرسوجوها و متن کاربر) با پردازندهی Gaudi2 حدود ۲٫۸ برابر سریعتر از پردازندهی ۸۰ گیگابایتی A100 انویدیا صورت گرفت و ایتان مدینه نیز در توضیح این مقایسه گفت:
مقایسهی Gaudi2 با V100 و A100 انویدیا از آن جهت حائز اهمیت است که هر دو در فضای ابری و داخلی کاربرد زیادی دارند.
کارت PCI Mezzanine یا PMC مجموعه برد مدار چاپی است که طبق استاندارد IEEE P1386.1 ساخته شده است. این استاندارد ویژگیهای الکتریکی PCI را با ابعاد مکانیکی Common Mezzanine Card یا فرمت CMC (استاندارد IEEE 1386) ترکیب میکند.
پردازندهی Gaudi2 در حال حاضر در قالب کارت Mezzanine یا قسمتی از سرور HLS-Gaudi2 برای مشتریان هابانا دردسترس است. سرور HLS-Gaudi2، سروری برای ارزیابی Gaudi2 بوده که از هشت کارت مجهز به Gaudi2 و یک سابسیستم Xeon اینتل با دو سوکت تشکیل شده است. هابانا همچنین قصد دارد با همکاری Supermicro سروری آموزشی مجهز به پردازندهی هوش مصنوعی Gaudi2 (به نام Supermicro X12 Gaudi2 Training Server) را در سهماههی سوم ۲۰۲۲ عرضه کرده و نسخهای از این سرور را با استفاده از فناوری DDN به حافظهی متمرکز بر هوش مصنوعی مجهز کند.
علاوهبراین، هزاران پردازندهی Gaudi2 در حال حاضر در مراکز دادهی هابانا قرار دارند که برای بهینهسازی نرمافزارها و توسعهی نسخهی بعدی این پردزاندهی تعلیمدهی مورد استفاده قرار میگیرند.
در مورد پردازندهی Greco نیز، آزمایشگاه هابانا آن را از حالت دو اسلات به حالت تک اسلات تبدیل کرد و توان مصرفی آن را از ۲۰۰ وات به ۷۵ وات کاهش داد. ایتان مدینه دربارهی این پردازندهی استنباطی افزود:
به دلیل فرم فشرده Greco، کاربران میتوانند تعداد شتابدهندهها را در همان سیستم میزبان دو برابر کنند.
بااینحال تیم آبی، هنوز اطلاعات بیشتری دربارهی این پردازنده به اشتراک نگذاشته است.
Gaudi2 و Greco جدیدترین محصولات اینتل برای رقابت در دنیای شتابدهندههای هوش مصنوعی هستند که نهتنها در پردازندههای گرافیکی انویدیا، بلکه در شتابدهندههای تخصصی دیگری مانند Cerebras، Graphcore و SambaNova نیز استفاده میشوند. البته مقایسههایی که اینتل با این دو پردازنده و محصولات مشابه انویدیا انجام داده، مقایسه با پردازندهی گرافیکی H100 انویدیا را شامل نمیشوند؛ پردازندهی گرافیکی H100 انویدیا به ۸۰ میلیارد ترانزیستور مجهز است که قرار است سرعتی بالاتر از A100 را به ارمغان آورند.
به گفته ساندرا ریورا، معاون اجرایی و مدیر گروه دیتاسنتر و هوش مصنوعی اینتل، پردازندههای جدید هابانا نمونهی برجستهای از دستاوردهای هوش مصنوعی اینتل در ارائهی راهکارهای مناسب برای پاسخ به تعداد فزاینده و ماهیت پیچیدهی کارهای مبتنی بر هوش مصنوعی هستند.
دستاوردهای پردازندهی Gaudi2:
بهرهوری تعلیمدهی یادگیری ماشینی:
پردازندهی Gaudi2 هابانا، براساس همان معماری نسل اول Gaudi با کارایی بالا توسعه داده شده است و عملکرد آموزشی فضای ابری را در سرورهای خدمات تحت وب آمازون (AWS) تا ۴۰ درصد بهبود میبخشد. تغییر فرایند تولید پردازندهی Gaudi2 از ۱۶ نانومتر به ۷ نانومتر، جهش قابلتوجهی در قابلیتهای محاسباتی، حافظه و شبکه را نوید میدهد. این پردازندهی هوش مصنوعی به موتور پردازش رسانهی داخلی نیز مجهز است که برای فشردهسازی رسانه و تخلیهی سیستم میزبان بهکار میرود. در Gaudi2 ظرفیت حافظهی HBM2E با پهنای باند ۲٫۴۵ ترابایتبرثانیه از ۳۲ گیگابایت به ۹۶ گیگابایت افزایش داده شده و ۲۴ کارت داخلی ۱۰۰ گیگابیتی برای افزایش و کاهش مقیاس اترنت استاندارد در نظر گرفته شده است.
مزایا برای مشتریان:
پردازندهی Gaudi2 در مقایسه با شتابدهندههای سنتی مبتنی بر پردازندههای گرافیکی، امکان تعلیمدهی کارآمدتری و بهصرفهتری را برای مشتریان فراهم میکند. کاهش زمان مورد نیاز برای تعلیمدهی در Gaudi2، میتواند با ارائهی دیدگاهها ومدلسازی بهتر، زمان ورود به بازار را تسریع کرده و به کسبوکارها رونق بخشد. درواقع میتوان گفت که Gaudi2 با هدف بهبود مدلسازی بینایی برای استفاده در وسایل نقلیهی خودران، تصویربرداری پزشکی، شناسایی نقصهای تولید و پردازش زبان طبیعی، توسعه داده شده است.
افزایش ظرفیت شبکه، انعطافپذیری و کارایی:
هابانا با افزایش پهنای باند قابلیت آموزش در نسل دوم Gaudi، هزینههای فرایند آموزشی را کاهش داده است. به لطف یکپارچهسازی استاندارد صنعتی RoCE روی این تراشه و انحصارزدایی اینتل، مشتریان بهراحتی میتوانند این پردازنده را متناسب با نیازهای خود، مقیاسبندی کرده و با پیادهسازی گستردهی سیستم روی اتصال اترنت استاندارد صنعتی، هزینهی کمتری بپردازند.
سادهسازی و ارتقای نسخهی جدید:
هابانا مجموعه نرمافزاری ®SynapseAI را برای توسعهی مدلهای یادگیری عمیق و انتقال مدلهای مبتنی بر گرافیکهای موجود به سختافزار پلتفرم Gaudi طراحی کرده است. این نرمافزار ابتدا امکان آموزش مدلها را به کمک پردازندهی Gaudi2 فراهم میکند و کاربر پس از آن میتواند این مدل آموزشیافته را در پردازندههای Xeon اینتل یا Greco استنباط کند.
دردسترس بودن راهحلهای آموزشی:
هابانا ازطریق وبسایت مخصوص توسعهدهندگان اسناد و ابزارهای لازم برای توسعهی پیشرفتهتر کرنلها دراختیار مشتریان قرار میدهد و مشتریان میتوانند پس از خرید پردازندهی Gaudi2 از افزایش ظرفیت ذخیرهسازی هوش مصنوعی و راهحلهای ذخیرهسازی بهرهمند شوند.