DeepSeek:让世界热议的中国人工智能应用

Getty Images DeepSeek 应用程序的照片,背景是中国国旗

中国人工智能初创公司DeepSeek 荣登应用程序下载排行榜榜首并导致美国科技股下跌,成为全球头条新闻。

今年 1 月,该公司发布了最新模型 DeepSeek R1,据称该模型的功能可与 ChatGPT 制造商 OpenAI 开发的技术相媲美,但开发成本却低得多。

它的受欢迎程度和潜力让投资者感到震惊,导致芯片巨头英伟达的市值蒸发数十亿美元,也让人们质疑美国公司是否会像许多人认为的那样,主导蓬勃发展的人工智能(AI)市场。

总统唐纳德·特朗普称这是对美国企业的“警钟”。

什么是人工智能?

要理解 DeepSeek 为何引起如此轰动,首先要了解人工智能及其使计算机像人一样的能力。

机器利用技术来学习和解决问题,通常是通过对大量信息进行训练和识别模式来实现的。

最终的结果是软件可以像人一样对话或预测人们的购物习惯。

近年来,它最为人熟知的是作为 ChatGPT 和 DeepSeek 等聊天机器人背后的技术,也称为生成式人工智能。

这些程序再次从大量数据(包括在线文本和图像)中学习,以便能够创建新的内容。

但这些工具也可能产生虚假信息,并且经常重复其训练数据中包含的偏见。

数百万人使用 ChatGPT 等工具来帮助他们完成日常任务,例如撰写电子邮件、总结文本和回答问题 – 其他人甚至使用它们来帮助进行基本的编码和学习。

什么是 DeepSeek?

DeepSeek 是一个免费的人工智能聊天机器人的名称,它的外观、感觉和工作方式与 ChatGPT 非常相似。

这意味着它可以用于许多相同的任务,但与竞争对手相比其效果究竟如何还有待商榷。

据报道,它在数学和编码等任务上与 OpenAI 去年底发布的 o1 模型一样强大。

和 o1 一样,R1 也是一种“推理”模型。这些模型会逐步产生响应,模拟人类如何推理问题或想法。

Deepseek 表示,它能够以低成本做到这一点——其背后的研究人员声称,训练成本为 600 万美元(480 万英镑),仅为 OpenAI 老板 Sam Altman 在讨论 GPT-4 时提到的“1 亿多美元”的一小部分。

它似乎还能够将美国限制对最强大芯片进入中国的影响降至最低。

据报道,DeepSeek 的创始人建立了一个 Nvidia A100 芯片商店,该芯片自 2022 年 9 月起被禁止出口到中国。一些专家认为,他将这些芯片与更便宜、不太复杂的芯片配对,最终实现了更高效的流程。

DeepSeek 还比其竞争对手占用更少的内存,最终降低了用户执行任务的成本。

性能和低成本的结合帮助 DeepSeek 的 AI 助手在美国发布时成为苹果 App Store 上下载次数最多的免费应用程序。

该公司表示,同一天,其网站遭受了“大规模恶意攻击”,导致公司暂时限制注册数量。

其网站也遭遇中断。

与许多其他中国人工智能模型(百度的 Ernie 或字节跳动的豆包)一样,DeepSeek 经过训练以避开政治敏感问题。

当 BBC 询问该应用程序1989 年 6 月 4 日天安门广场发生了什么时,DeepSeek 并未透露有关这场大屠杀的任何细节,因为这场大屠杀在中国是一个禁忌话题,受到政府的审查。

DeepSeek 背后是谁?

DeepSeek 由梁文峰于2023年12月创立,并于次年发布首个AI大型语言模型。

梁先生毕业于浙江大学,拥有电子信息工程和计算机科学学位,人们对他的了解不多。但他现在已成为国际关注的焦点。

他最近出席了由中国总理李强主持的一次会议,这反映出 DeepSeek 在人工智能行业日益突出的地位。

与很多来自硅谷的美国人工智能企业家不同,梁先生还拥有金融背景。

他是一家名为 High-Flyer 的对冲基金的首席执行官,该基金使用人工智能分析财务数据来做出投资决策,即所谓的量化交易。2019 年,High-Flyer 成为中国首家募资超过 1000 亿元人民币(1300 万美元)的量化对冲基金。

梁在当年的一次演讲中说道:“如果美国可以发展量化交易行业,中国为什么不能?”

他在去年一次罕见的采访中表示,中国的人工智能领域“不能永远做美国人工智能发展的追随者”。

当被问及 DeepSeek 的模式为何让硅谷如此之多人感到惊讶时,梁说:“他们之所以感到惊讶,是因为看到一家中国公司以创新者的身份加入他们的游戏,而不仅仅是追随者——而追随者是大多数中国公司已经习惯的情况。”

但它已引起全球领导人的关注。

澳大利亚已禁止在政府设备和系统上使用 DeepSeek,称其对国家安全构成威胁。

全球多个数据保护机构也要求 DeepSeek 澄清其如何处理个人信息——其将这些信息存储在中国的服务器上。

意大利于 1 月 30 日封锁了 DeepSeek 的应用程序,并出于数据保护考虑命令该公司停止处理其公民的个人信息。

英伟达等美国公司为何受到冲击?

DeepSeek 的成功打破了人们的信念:更大的预算和顶级芯片是推动人工智能发展的唯一途径,这一前景给高性能芯片的未来带来了不确定性。

Counterpoint Research 首席人工智能分析师孙伟表示:“DeepSeek 已经证明,可以使用有限的计算资源开发尖端的人工智能模型。”

“相比之下,估值 1570 亿美元的 OpenAI 面临着审查,即其能否在缺乏重大回报的情况下保持创新主导优势或证明其巨额估值和支出的合理性。”

1 月 27 日,DeepSeek 明显较低的成本震动了金融市场,导致科技股占比较高的纳斯达克指数下跌超过 3%,全球芯片制造商和数据中心也遭遇抛售。

英伟达股价周一暴跌 17%,周二才开始回升。

按市值衡量,这家芯片制造商曾是全球最有价值的公司。

但《福布斯》报道称,该公司周一跌至仅次于苹果和微软的第三位,市值从 3.5 万亿美元缩水至 2.9 万亿美元。

DeepSeek 是一家私营公司,这意味着投资者不能在任何主要交易所购买股票。

  • 中国的 DeepSeek AI 震撼行业,削弱美国的霸气

观看:DeepSeek AI 机器人回答 BBC 关于天安门广场的问题

中国对于DeepSeek的影响有何反应?

DeepSeek 的崛起对中国政府来说是一个巨大的推动,中国政府一直在寻求打造独立于西方的科技。

虽然共产党尚未发表评论,但中国官方媒体急切地指出,硅谷和华尔街的巨头们对 DeepSeek 的“担忧”正在“颠覆”美国股市。

悉尼科技大学副教授玛丽娜·张 (Marina Zhang) 表示:“在中国,DeepSeek 的进步被视为中国日益增强的技术实力和自力更生能力的证明。”

“该公司的成功被视为中国创新2.0的验证,这是由年轻一代企业家推动的本土技术领导力的新时代。”

但她也警告称,这种情绪也可能导致“科技孤立主义”。