NVIDIA 的新款 GB200 NVL72 AI 服务器在开发过程中遇到了一些重大挑战,这些挑战主要来自于其惊人的 132kW TDP(热设计功耗)。这使得它成为了史上功耗最高的服务器。

在 Medium 的一篇新文章中,分析师 Ming-Chi Kuo 指出,NVIDIA 已经暂停了其 GB200 NVL36x2 AI 服务器(双机架 72 GPU 版本)的开发。NVL72 的发展面临的最大挑战来自于 132kW 的热设计点(TDP),这要求 NVIDIA 和其供应链需要更多时间来解决这些前所未有的技术问题。

需要注意的是,TDP 指的是连续运行期间的平均功耗。如果设计不当导致峰值功耗(NVIDIA 称之为电设计点(EDP))超过 TDP,可能需要两个或更多的辅助设备。这不仅会增加冷却设计的复杂性和生产难度,还会抵消 NVL72 在数据中心空间节省方面的优势。

辅助设备的另一个设计挑战是稳定地控制接近的温度在 5-10°C 范围内。放宽这个标准可能会影响系统稳定性。

值得注意的是,上述提到的功耗挑战不仅涉及辅助设备,还涉及所有组件和系统设计。

我的最新供应链调查表明,NVL72 的量产可能推迟到 2025 年第二季度(与 NVIDIA 乐观的 2025 年第一季度目标相比)。