مدیرعامل انویدیا از شروع تولید انبوه تراشه گرافیکی Hopper خبر داد

{title limit=50}

جن‌سون هوانگ، مدیرعامل انویدیا، در جریان برگزاری رویداد GTC که با رونمایی معماری Ada Lovelace و کارت‌های گرافیک RTX 4090 و RTX 4080 همراه بود، اعلام کرد پردازنده‌‌ی گرافیکی مبتنی‌بر معماری Hopper وارد مرحله‌ی تولید انبوه شده‌ و از ماه آینده‌ی میلادی در داخل سیستم‌هایی که توسط شرکای تجاری تیم سبز نظیر دل و سیسکو تولید می‌شوند، دردسترس قرار می‌گیرد. هوانگ همچنین گفته است سیستم‌های اختصاصی انویدیا با پردازنده‌ی گرافیکی Hopper در فصل اول سال ۲۰۲۳ عرضه خواهند شد.

به گزارش ZDNet، تراشه‌‌ی H100 انویدیا که بر پایه‌ی معماری Hopper ساخته شده مخصوص پردازش‌های دیتاسنتر نظیر هوش مصنوعی است. انویدیا می‌گوید که H100 هزینه‌ی پیاده‌سازی برنامه‌های هوش مصنوعی را به شکل قابل‌ توجهی کاهش می‌دهد.

براساس گفته‌ی انویدیا، پردازش‌هایی که قبلا ازطریق ۳۲۰ تراشه‌ی رده‌بالای A100 قابل انجام بودند به‌لطف پیشرفت‌های معماری Hopper با ۶۴ پردازند‌ه‌ی H100 قابل انجام هستند (H100 در بازار جایگزین A100 می‌شود). انویدیا می‌گوید در این مثال به تنها یک‌پنجم از سرورهای استفاده‌شده برای A100 نیاز است و میزان مصرف انرژی نیز ۳٫۵ برابر کاهش می‌یابد.

انویدیا فروردین‌ماه امسال از معماری Hopper پرده‌برداری کرد و ماه گذشته شاهد انتشار اولین بنچمارک‌های این معماری در مجموعه‌ای از پردازش‌های یادگیری ماشین بودیم. بنچمارک‌ها به وضوح نشان دادند انویدیا در Hopper به بهبودهای قابل توجهی دست پیدا کرده است.

جن‌سون هوانگ در مراسم اخیر افزون‌بر اشاره به شروع تولید انبوه Hopper گفت انویدیا سرویس ابری جدیدی به نام Nvidia NeMo LLM برای مدل‌های زبانی بزرگ دارد. به‌لطف این سرویس، کاربران می‌توانند به‌سادگی «مدل‌های بسیار بزرگ پردازش زبان طبیعی (NLP)» نظیر OpenAI GPT-3 و Megatron-Turing NLG 530B را مورد استفاده قرار دهند. انویدیا در همکاری با مایکروسافت Megatron-Turing NLG 530B را توسعه داده است.

سرویس NeMo که از ماه آینده‌ی میلادی به‌صورت اولیه و محدود دردسترس قرار می‌گیرد، مدل‌های زبانی GPT-3 را به‌صورت پیش‌تعلیم‌داده‌شده دردسترس قرار می‌دهد. انویدیا می‌گوید که توسعه‌دهندگان می‌توانند ازطریق فرآیندی که این شرکت «یادگیری بی‌درنگ» می‌نامد، مدل‌های زبانی را اصلاح کنند. انویدیا روش یادگیری بی‌درنگ را از روی تکنیکی که دانشمندان گوگل در سال ۲۰۲۱ معرفی کردند طراحی کرده است.

نسخه‌ای از سرویس NeMo که BioNeMo نام دارد به‌طور انحصاری به حوزه‌ی زیست‌پزشکی اختصاص داده می‌شود. این سرویس دسترسی به مدل‌های هوش مصنوعی را برای انجام کارهایی مثل کشف دارو امکان‌پذیر می‌کند.






ارسال نظر

عکس خوانده نمی‌شود
11