近日,一家名为深探(DeepSeek)的中国人工智能公司取得了显著的成功。他们的AI助手应用成为了苹果应用商店中的免费应用榜首,甚至超过了广为人知的ChatGPT应用。

深探的R1模型是这款应用的核心。该模型经过训练的成本仅为560万美元,但其性能却可以与OpenAI的o1模型相媲美,甚至在某些方面表现得更好。尽管OpenAI的o1模型训练成本高昂,但R1模型在性能上依然能够与之抗衡。

值得注意的是,尽管美国对高功率AI芯片实施了严格的出口限制,深探仍然成功地使用了NVIDIA H100 GPU进行训练。这表明深探在克服技术障碍方面有着强大的能力。

深探的R1模型拥有6710亿个参数,是一个非常庞大的模型。为了让更多用户能够使用,深探还提供了不同规模的“蒸馏”版本,参数从15亿到700亿不等。其中,最小的R1模型可以在笔记本电脑上运行,而完整的R1模型则需要更多的硬件支持。

然而,深探的R1模型价格非常具有竞争力。通过DeepSeek的API,用户可以以比OpenAI的o1模型便宜90-95%的价格获得R1模型。这一价格优势使得深探的应用在市场上具有很大的吸引力。

尽管如此,也有一些人对深探的做法表示质疑。例如,Curai的CEO Neal Khosla认为,深探的行为可能是中国政府的一种心理战和经济战,目的是让美国的人工智能变得无利可图。他指出,深探声称成本低是为了合理化低价策略,希望更多人转向使用他们的产品,从而损害美国的人工智能竞争力。

然而,Khosla的父亲是OpenAI的投资人,这可能影响他对深探的看法。