; f, t1 q7 }# O D- b2 U8 [Stability AI 曾经的研究主管 Tanishq Mathew Abraham 昨天挺身而出,以自己业内人士的身份下场,指出了 DeepSeek 极为特殊的几点: & x# j- C' i; _4 G# [& C ; e$ O' ^" ?, o1.性能实际上与 OpenAI 的 o1 一样好,这是一个前沿模型,标志着开源真正赶上了闭源# L Z* v. m$ c. {
, s D5 K4 R1 G
2.与其他前沿模型相比,DeepSeek 以相对较低的训练费用完成 l/ O, O1 k3 T3 w: f1 C 5 `; e( f5 N6 `. N: y, ^3.易于使用的界面,结合其网站和应用程序中可见的思维链,吸引了数百万新用户加入5 R. K- e6 H8 v5 |# t
* [) ]$ T* o3 \1 d除此之外,他更是针对几大流行的谣言,写了长长一篇博文,分析解释了围绕在 DeepSeek 四周的(离谱)言论。 ( W& f3 K0 G- x+ H& {( W 9 [( i& `* H. s! b7 i% Y) ~以下为博客文章,内容有所编辑: % W$ f, E8 I9 C5 t$ U# U! B; U+ l6 O [5 v1 z2 Z
2025 年 1 月 20 日,一家名为 DeepSeek 的天朝 AI 公司开源并发布了他们的推理模型 R1。鉴于 DeepSeek 是一家天朝公司,美国及其 AGI 公司存在各种「国家安全担忧」。由于这一点,**关于它的错误信息已经广泛传播。**1 c# F5 h: ?- D' k+ x7 h
% d C% E t" s; r( T$ Q. H" t8 x这篇文章的目的是反驳自 DeepSeek 发布以来,许多关于 DeepSeek 的极端糟糕的 AI 相关观点。同时,作为一个在生成式 AI 前沿工作的 AI 研究人员,提供更有平衡性的观点。$ \( g0 C, k1 r9 A+ _
: j5 W; C- x% Q5 u2 X
谣言 1:可疑!DeepSeek 是一家突然冒出来的天朝公司/ D3 a( j- ]$ K; L( T
完全错误,到 2025 年 1 月,几乎所有生成式 AI 研究人员都已经听说过 DeepSeek。DeepSeek 甚至在完整发布前几个月就发布了 R1 的预览!% W9 F* C& A9 B) r6 _* W
2 g. Y8 S' l. g" b- n% |% a: n任何传播这种谣言的人,很可能并不从事人工智能工作——如果你不涉足该领域,却以为自己了解这个领域的一切,是荒谬且极其自负的。 % `8 Y( F' \6 C" b2 Y% B, g: I; z9 @ Z% q( x9 U$ r- Q, z
DeepSeek 的首个开源模型 DeepSeek-Coder,于 2023 年 11 月发布。当时是业界领先的代码 LLMs(编者注:专注于理解和生成代码的语言模型)。正如下面的图表所示,DeepSeek 在一年内持续发货,达到 R1:" s2 }# m: Z" f5 H* R
) w- h, X+ S+ W- m7 c& t: J