中国初创公司DeepSeek 推出的全新聊天机器人正在全球范围内引起轰动。ChatGPT 的首席执行官称其为“令人印象深刻的人工智能模型”,美国总统唐纳德·特朗普甚至称其为美国科技公司敲响了“警钟”。比利时科技公司Imec的人工智能主管Steven Latré表示:“DeepSeek 似乎比竞争对手便宜很多,而且构建成本也低很多。”
我们对 DeepSeek 本身了解不多。该初创公司由名不见经传的梁文峰于 2023 年 7 月创立,并于两周前向全球发布了其R1模型。日本数字事务部长平正明表示,DeepSeek 的成功表明中国在人工智能领域并不像之前认为的那么落后。
Deepseek的AI有何不同?
DeepSeek的R1模型与ChatGPT一样,是一种由人工智能驱动的高级语言模型。它可以用于解决复杂的数学问题、编码和分析数据等。该模型实现了与OpenAI于2024年12月推出的o1-ChatGPT模型类似的性能。最大的区别在于价格。DeepSeek的R1模型不仅完全免费,而且还可以在更便宜的Nvidia芯片上运行,因此构建成本要低得多。
这对于该行业意味着什么?
唐纳德·特朗普称这是对美国科技公司的“警钟”。芯片制造商Nvidia在一份新闻稿中表示,DeepSeek的模型“代表了人工智能领域的杰出进步”。OpenAI首席执行官Sam Altman对此次表示赞赏,并称其为“令人印象深刻的模型”。
鲁汶科技公司Imec的人工智能主管Steven Latré谈到了该领域的一场“革命”,这不仅仅是因为中国人显然已成功大幅降低了成本。“DeepSeek 使用的代码也是开源的,”Latré说道。这意味着每个人都可以清楚地看到中国人是如何运作的。“任何人都可以下载该模型的代码,将其放在自己的计算机上并在此基础上进行构建。”
“我认为这本身将是一场额外的革命,因为我们可以真正进一步改善这一点。在人工智能短暂的历史中,你有时会只见树木不见森林,但这是历史上一个巨大的重要里程碑。”
大家都来玩Deepseek吗?
“我不会建议大家都从ChatGPT转换到DeepSeek,”Latré在广播节目上警告使用中国软件的隐私风险时说道。“我认为我们需要区分模型本身和模型背后的技术。当你使用模型本身时,这确实意味着你正在将数据发送到中国的计算机。数据隐私法,例如GDPR法律在他们那里没有,这肯定会带来一定的风险。”
Imec已经深入研究了该模型的代码,并从中国下载了代码,正在本国自己的计算机上使用这项新技术。
DeepSeek的AI模型也显露出缺陷。据说该模型受”审查限制“,不愿回答有关中国历史等敏感问题。“我们有时还会在其他语言模型中看到开发人员的意识形态渗透进来,”Latré说。