超微公司(SuperMicro)最近推出了其新的NVIDIA GB200 NVL72超级集群,这是一个集成的液冷Exascale计算系统,设计在一个机架内。以下是该系统的详细信息:

1. **集群配置**:该系统包含72个NVIDIA Blackwell B200 GPU,这些GPU协同工作,仿佛是一个单一的GPU,并拥有庞大的HBM3e内存池(每个机架130TB)。

2. **高速互连**:系统配备了9个NVLink交换机,每个计算托盘有4个端口,用于连接72个GPU,提供1.8TB/s的GPU到GPU互连。

3. **冷却和电源**:超微公司提供了250kW容量的机架内冷却液分配单元,带有冗余电源和双热插拔泵,或者240kW / 180kW容量的液冷至空气解决方案(无需设施用水)。

4. **液冷解决方案和服务**:超微公司提供端到端的液冷解决方案和全面的现场部署服务。

5. **网络技术**:系统准备采用先进的网络技术进行扩展,包括NVIDIA BlueField®-3超级网络接口卡(SuperNIC)、Spectrum™-X、Quantum-2和下一代800 Gb/s网络平台。

该超级集群旨在加速关键企业用例的交付时间,同时消除构建大型集群的复杂性,这在以前只能通过超级计算的高强度设计和耗时优化来实现。