نسل جدید پردازندههای انویدیا با افزایش چشمگیر بازدهی، توانایی پردازش مدلهای سنگین هوش مصنوعی را به شکل قابل توجهی ارتقا دادهاند.
به گزارش تکراتو و به نقل از gizmochina، پردازندههای گرافیکی جدید GB300 مبتنی بر معماری Blackwell شرکت NVIDIA در تستهای اولیه نشان دادهاند که در مقایسه با نسل قبلی خود، به شکل چشمگیری کارایی هوش مصنوعی را افزایش میدهند.
در بنچمارک CoreWeave با استفاده از مدل DeepSeek R1، تنها چهار کارت GB300 عملکردی برابر با ۱۶ کارت H100 ارائه کردند. این یعنی هر کارت حدود شش برابر بازدهی بیشتری نسبت به نسل قبلی دارد که ناشی از بهبود سختافزار و معماری بهینهتر است.
پلتفرم GB300 NVL72 میتواند تا ۳۷ ترابایت حافظه با پهنای باند ۱۳۰ ترابایت بر ثانیه پشتیبانی کند و امکان پردازش مدلهای بسیار بزرگ هوش مصنوعی را بدون مشکلات نسخههای قدیمی فراهم میکند.
این سیستم از موازیسازی تنسوری ۴راهه استفاده میکند، در حالی که H100 برای رسیدن به مقیاس مشابه به موازیسازی ۱۶راهه نیاز داشت. تقسیم کمتر یعنی کاهش سربار ارتباطی و فناوریهای NVLink و NVSwitch نسل پنجم NVIDIA به پایین نگه داشتن تاخیر کمک میکنند.
برای کسبوکارهایی که سرویسهای بزرگ هوش مصنوعی اجرا میکنند، این به معنای تولید سریعتر توکنها، کاهش هزینه هر محاسبه و مسیر سادهتر برای مقیاسبندی است.
CoreWeave اشاره کرده که این افزایش کارایی به شکل مستقیم در مدلهای استنتاجی که عملکرد به ازای توان و تاخیر اهمیت بالایی دارد، مفید خواهد بود.
البته این سختافزار ارزان نخواهد بود و سیستمهای مبتنی بر GB300 NVL72 قیمتی حدود ۳۰۰ هزار دلار دارند و عمدتاً برای محیطهای سازمانی مناسب هستند. اما برای شرکتهایی که سرمایهگذاری سنگینی روی زیرساخت هوش مصنوعی کردهاند، این جهش کارایی میتواند هزینه را توجیه کند.
اگر این اعداد اولیه در استقرارهای واقعی نیز تأیید شوند، GB300 یکی از بزرگترین جهشهای نسلی NVIDIA در پردازش هوش مصنوعی و یک استاندارد جدید برای محاسبات پیشرفته خواهد بود.
طراحی و اجرا :
وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است
دیدگاهتان را بنویسید