قدرتمندترین رقیب چینی NVIDIA ،کارتهای گرافیکی هوش مصنوعی و خوشههای سرور محاسباتی هوشمند را معرفی کرد!
شرکت تولید کننده کارتهای گرافیکی چینی Moore Threads، محصول جدید خود یعنی mtt s4000 را برای بارگیریهای محاسباتی هوش مصنوعی و دیتاسنتر معرفی کرده است. Moore Threads همچنین در همکاری با شرکتهای دیگر چینی از جمله لنوو برای راهاندازی سختافزار و نرمافزار اکوسیستم خود به نام kuae در تلاش است.
اگرچه Moore Threads تمام جزئیات مربوط به کارت گرافیکی S4000 خود را فاش نکرده است، اما بدون شک این محصول بهبود قابل توجهی نسبت به مدلهای S2000 و S3000 دارد. این کارت گرافیکی جدید از معماری نسل دوم MUSA (معماری یکپارچه سیستم Moore Threads) استفاده میکند، در حالی که مدلهای S2000 و S3000 از معماری نسل اول استفاده میکردند.
(توجه: Moore Threads هر دو مدل S2000 و S3000 را به عنوان “معماری نسل اول MUSA” لیست کرده است، اما دیگران ادعا کردهاند که مدلهای S2000 و S80 از “معماری نسل دوم Chunxiao” استفاده کردهاند. به نظر میرسد منطقیتر باشد که S3000 به عنوان “معماری نسل دوم” شناخته شود، زیرا Moore Threads به طور خاص مدل S4000 را “سومین نسل” معرفی کرده است، اما ما هنوز صفحه محصولی برای آن نداریم.
S4000 همچنین دارای قابلیتهای حیاتی دادههای GPU به GPU است، با اتصال داده 240 گیگابایت بر ثانیه از یک کارت به کارت دیگر و پشتیبانی از RDMA. این با پهنای باند 900 گیگابایت بر ثانیه NVLink در هاپر فاصله زیادی دارد، اما S4000 احتمالاً یک پردازنده گرافیکی بسیار ضعیفتر است که باعث میشود چنین مقدار زیادی از پهنای باند بیش از حد استفاده شود.
علاوه بر S4000 شرکت Moore Threads همچنین مرکز محاسبات هوشمند KUAE خود را معرفی کرده است. Moore Threads ادعا میکند که هر خوشه کیلوکارد KUAE دارای 1000 کارت گرافیکی است، که به معنای وجود کلیه 125 سرور MCCX D800 در هر خوشه است.
در زمینه نرمافزار، Moore Threads ادعا میکند که KUAE از مدلهای زبان بزرگ مانند GPT و چارچوبهایی مانند DeepSpeed پشتیبانی میکند.
ابزار Musify این شرکت ظاهراً به S4000 اجازه می دهد تا با اکوسیستم نرم افزار CUDA بر اساس GPU های NVIDIA همکاری کند ، که باعث می شود تا موضوعات مور و صنعت نرم افزار چین از اختراع چرخ استفاده کند!
ظاهراً یک خوشه Kuae می تواند تقریباً یک ماه یک مدل هوش مصنوعی را آموزش دهد ، هرچند که به برخی از جزئیات بستگی دارد.
به عنوان مثال ، مور Threads می گوید مدل Aquila2 با 70 میلیارد پارامتر 33 روز طول می کشد تا راه اندازی شود ، اما دست زدن به پارامترها تا 130 میلیارد ، زمان آموزش را به 56 روز افزایش می دهد.
پشتیبانی از این نوع اکوسیستم سخت افزار و نرم افزاری برای هر شرکتی چالش برانگیز خواهد بود ، اما این امر به تنهایی برای Moore تقریباً غیرممکن خواهد بود ، به خصوص پس از آنکه مجبور شد بسیاری از کارمندان خود را کنار بگذارد.