NVIDIA推出的Blackwell AI服务器在过热和架构缺陷方面持续出现问题,导致主要客户如亚马逊、谷歌、Meta和微软减少订单,并回归到Hopper AI服务器。
NVIDIA首席执行官黄仁勋承认存在设计缺陷,将GB200 AI服务器的大规模生产推迟至2025年第二季度或第三季度。
据报道,NVIDIA的新GB200 AI服务器在去年就遇到了过热和架构缺陷的问题,这些问题似乎并未解决,导致大客户(支付高额费用)陷入困境,转而使用Hopper AI服务器。
根据The Information的最新报道,NVIDIA GB200 AI服务器的首批重大出货量中,大客户遇到了过热和故障问题,主要问题是“芯片连接方式”。亚马逊、谷歌、Meta和微软等大客户因问题而削减了订单。
去年10月,NVIDIA首席执行官黄仁勋表示,“Blackwell存在设计缺陷,这是100%的NVIDIA责任”,并指出这与台积电新CoWoS先进封装的传闻问题无关。几个月后,在2024年12月,我们报道了NVIDIA GB200 AI服务器的大规模生产和峰值出货可能被推迟至2025年第二季度甚至第三季度...现在又出现了更多问题。