微软 CEO 的评价

  • 在 2025 年达沃斯世界经济论坛上,微软 CEO Satya Nadella 对 DeepSeek 表示高度关注:

    “他们的开源模型在推理效率上令人印象深刻。这是中国技术崛起的一个警示信号,我们必须认真对待。”

其他专家的观点

  • Benchmark Partners 的 Chetan Puttagunta
    • 认为中国的创新源于资源受限的情况下对高效技术的追求:

      “他们通过必要的创新,开发了更加经济高效的解决方案。”

  • Perplexity CEO Aravind Srinivas
    • 指出中国的技术路径是通过寻找迂回路线,解决了传统技术方案的高成本问题。

CNBC 40分钟来报道DeepSeek:中国一家鲜为人知的人工智能实验室引发硅谷恐慌

全文翻译:

中国一家鲜为人知的人工智能实验室引发硅谷恐慌

一家来自中国的鲜为人知的人工智能实验室发布了一款 AI 模型,该模型不仅能超越美国顶尖模型,而且开发成本更低,所用芯片性能也不如美国的高端硬件。这一消息在硅谷引发了恐慌。

这家实验室名为 DeepSeek,去年 12 月底发布了一款免费开源的大型语言模型。该实验室表示,这款模型仅用了 两个月 时间开发,耗资不到 600 万美元,使用的是 Nvidia 的 H800 芯片(一种性能较低的芯片)。

这一进展引发了人们对美国在人工智能领域全球领先地位是否正在缩小的担忧,也质疑科技巨头在构建 AI 模型和数据中心方面的巨额投资是否合理。


DeepSeek 的模型表现

在一系列第三方基准测试中,DeepSeek 的模型在从复杂问题求解到数学与编程等任务的准确性上,超越了以下美国顶尖模型:

  • Meta 的 Llama 3.1
  • OpenAI 的 GPT-4o
  • Anthropic 的 Claude Sonnet 3.5

本周一,DeepSeek 发布了一款名为 r1 的推理模型。在许多第三方测试中,该模型同样超越了 OpenAI 最新的 o1


国际反响

微软 CEO Satya Nadella 在瑞士达沃斯世界经济论坛上表示:

“看到 DeepSeek 的新模型,无论是他们如何高效地构建了一个开源模型,还是在推理计算效率上的表现,都非常令人印象深刻。我们必须非常认真地对待来自中国的这些发展。”


突破美国的芯片限制

DeepSeek 还面临着美国政府对中国实施的严格半导体出口限制,这些限制切断了中国获取最强大芯片(如 Nvidia H100)的渠道。然而,DeepSeek 的最新进展表明:

  1. 他们可能找到了规避规则的方法。
  2. 或者,美国的出口限制并未对中国的发展产生预期中的“扼制”效果。

Benchmark 基金的普通合伙人 Chetan Puttagunta 解释了其中一种关键技术:

“他们可以使用一种称为蒸馏(distillation)的方法。基本上,你可以用一个非常好的大模型来帮助小模型快速学习特定任务。这种方法实际上非常高效。”


DeepSeek 的背景

关于该实验室及其创始人梁文峰(Liang WenFeng)的信息目前所知不多。据媒体报道,DeepSeek 诞生于一家名为 High-Flyer Quant 的中国对冲基金,该基金管理着大约 80 亿美元 的资产。


其他中国公司的进展

DeepSeek 并非唯一取得进展的中国公司。

  1. 01.ai 初创公司
    著名 AI 研究员 李开复 表示,他的初创公司 01.ai 仅用 300 万美元 完成了模型训练。
  2. 字节跳动(TikTok 母公司)
    本周三,字节跳动发布了其模型的更新版本。据称,这一模型在关键基准测试中超越了 OpenAI 的 o1

创新因需求而生

Perplexity CEO Aravind Srinivas 评价说:

“需求是创新之母。因为他们不得不想办法找到替代方案,最终他们实际上开发出了更加高效的技术。”