在刚刚公布的MLPerf基准测试中,英伟达Blackwell Ultra GB300 NVL72系统火力全开,以45%的推理性能提升碾压前代GB200,为AI数据中心树立新标杆!
这场硬件与算法的双重变革中,最抢眼的当属专为Transformer优化的新一代张量核心。相比Blackwell初代,其注意力层加速能力翻倍,算力更是跃升50%。配合首创的NVFP4量化格式,DeepSeek R1模型体积大幅精简,精度却依然坚挺——这波操作堪称'瘦身不减肌肉'的典范。
面对4000亿参数的Llama 3.1大模型,英伟达展现'72变'神技:通过1.8TBps极速NVLink网络,将算力均匀分布到72颗GPU上。这种'化整为零'的并行方案,既保障了吞吐量激增,又守住了延迟红线。难怪英伟达敢宣称,GB300能为'AI工厂'省下真金白银。
值得注意的是,这场性能盛宴背后的生态布局更为精妙——NVFP4不仅是算法的胜利,更暗合英伟达'算力货币化'的战略野心。随着本月GB300正式发货,AI数据中心或将迎来新的计价范式。不过,面对华为CloudMatrix等国产方案的突袭,黄仁勋的护城河还能坚挺多久?这场算力军备竞赛,远比纸面参数更值得玩味。