不仅开源还便宜好用硅谷员工直呼“火烧屁股”的DeepSeek大模型强在哪

发布日期: 2025-04-11

  邦产大模子公司深度求索(DeepSeek)颁发的最新AI(人工智能)大模子正在海外惹起开拓者和投资者的热议。

  1月20日,量化巨头幻方量化旗下大模子公司DeepSeek正式颁发推理大模子DeepSeek-R1。举动一款开源模子,R1正在数学、代码、自然讲话推理等职业上的本能不妨比肩OpenAI o1模子正式版,并采用MIT许可订定,增援免费商用、肆意改正和衍生开拓等。目前,正在海外大模子排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名依然升至全种别大模子第三,与OpenAI的ChatGPT-4o最新版并列,并正在格调把握类模子(StyleCtrl)分类中与OpenAI的o1模子并列第一。

  更令商场吃惊的是,据DeepSeek先容,R1的预锻炼用度只要557.6万美元,正在2048块英伟达H800 GPU(针对中邦商场的低配版GPU)集群上运转55天告终,仅是OpenAI GPT-4o模子锻炼本钱的不到异常之一。DeepSeek显露,R1正在后锻炼阶段大周围操纵了深化练习技能,正在仅有极少标注数据的状况下,极大提拔了模子推理才具。别的,DeepSeek不单将R1锻炼技能全数公然,还蒸馏了6个小模子向社区开源,愿意用户借此锻炼其他模子。

  已经推出,DeepSeek-R1便依据其“物美价廉”的特质正在海外开拓者社区中激励了惊动。正在API订价方面,DeepSeek R1任职对每百万输入token收取0.55美元,对每百万输出token收取2.19美元/百万,而OpenAI最新版o1模子的相应收费分辨为15美元/百万和60美元/百万。正在海外AI社区中小着名气的磋商者Shubham Saboo显露,举动一款“100%开源”的模子,R1比OpenAI o1低贱96.4%,同时供应近似的本能,发起依然订阅ChatGPT的开拓者“放弃浸没本钱”。

  除了本能方面的出色出现外,DeepSeek还给出了新的AI大模子搭修思绪。英伟达高级磋商科学家Jim Fan显露,DeepSeek-R1或许是“首个浮现了RL(深化练习)飞轮能够阐明感化且能带来延续增加的OSS(开源软件)项目”。此中,“飞轮”用来描写AI体系中自我深化、正向轮回的进程。DeepSeek的论文显示,分歧于过去AI模子往往依赖于监视微调(SFT,指AI模子通过已标注的数据实行锻炼),R1统统由深化练习驱动,证实了直接深化练习是可行的。

  Jim Fan写道:“咱们正处于一个诡秘的期间线上,一家非美邦公司正正在践行OpenAI最初的责任,即告竣真正怒放的前沿磋商并让全盘人受益。这种状况实在无法领略。最有文娱性的结果却是或许性最大的结果。”

  硅谷出名投资机构A16z的共同人、Mistral AI董事会成员Anjney Midha显露:“从斯坦福到麻省理工,DeepSeek-R1简直正在一夜之间成为美邦顶尖大学磋商职员的首选模子。”德邦马克斯·普朗克量子光学磋商所AI科学家试验室认真人马里奥·克伦(Mario Krenn)也盛赞DeepSeek-R1的怒放性,比拟之下,OpenAI旗下的模子“素质上都是黑箱”。

  依据极低的锻炼本钱,DeepSeek-R1也让华尔街和投资者觉得了动摇。1月24日,参投过OpenAI、Databricks、Character.AI等出名企业的危机投资巨头安德森·霍洛维茨基金(Andreessen Horowitz)的协同创始人马克·安德森(Marc Andreesen)连转了几篇合于Deepseek-R1的推文,并对其实行了公然称道。他正在X(原推特)平台上写道:“Deepseek R1是我睹过的最令人咋舌和印象长远的冲破之一——举动开源项目,它是对全邦的一份长远奉送。”

  随后,法邦企业家、推特定睹首领阿诺德·贝特朗(Arnaud Bertrand)转发了安德森的推文,并称中邦AI的成长速率令人惊艳:“Deepseek功夫不单是合于AI的,而是让全邦认识到中邦正在技能和革新方面依然领先了美邦,而且正在某些范围乃至超出了美邦,假使有人竭力不准这种状况的产生。”

  正在克日举办的2025年达沃斯论坛上,AI科技草创公司Scale AI创始人亚历山大·王(Alexandr Wang)显露,DeepSeek的AI大模子本能“大致与美邦最好的模子相当”。昨年12月,DeepSeek颁发上一代模子V3后,Alexandr Wang就正在X平台上评判道:“DeepSeek-V3带给外界的教训是:当美邦人正在苏息时,中邦人正在管事,并以更低贱、更疾、更强的产物奋起直追。”

  而Meta首席AI科学家杨立昆(Yann LeCun)指出,比起“中邦AI超越了美邦”的见解,DeepSeek-R1更紧急的是证实了“开源模子正正在超越专用模子”:“DeepSeek得益于开源磋商和开源项目(比如PyTorch和来自Meta的Llama)。这便是怒放磋商与开源的力气。”

  1月26日,360创始人周鸿祎发视频道“中邦大模子DeepSeek反超GPT”,称中美AI比赛“最终必定是中邦告捷”,就像中邦依然正在修设业范围打败了美邦:“DeepSeek这家公司迩来的出现实在逆天,我信赖畴昔倘使要抗拒美邦的AI技能霸权,中邦大模子技能复仇者同盟战队里必定有DeepSeek的一份,由于这家公司和它的创始人万分低调,他们技能才具和将来前景被商场主要低估了。”

  同时,商场初步猜度,DeepSeek-R1的横空出生是否会影响一味“砸钱”参加AI竞赛的美邦科技巨头们。阐发指出,AI行业比赛或将以比料思中更疾的速率加剧,并有或许影响到上逛AI硬件企业的收入。

  加州大学伯克利分校的AI策略磋商员Ritwik Gupta显露,DeepSeek-R1的产生证实了“AI才具没有技能护城河”,并称“中邦的体系工程师人才库比美邦大得众,他们懂得奈何富裕运用估量资源来更高效地锻炼和运转模子”。

  1月23日,一名Meta员工正在匿名职场论坛Teamblind上发帖称,Meta内部依然由于DeepSeek-R1而进入“着急形式”。这位员工写道:“Meta的工程师们正正在分秒必争地阐发DeepSeek,试图复制此中一起或许的技能,照料层正为天生式AI研发部分的巨额参加而忧愁。”

  该员工显露,DeepSeek-R1的锻炼本钱不到550万美元,而Meta的天生式AI部分里“每位引导的薪资都超出了这个数字”:“(AI部分)本应是一个以工程为中枢的小型构制,但由于许众人都思进来分一杯羹,人工膨胀了构制的周围,结果人人都是输家。”

  随后,有认证为谷歌员工的网友复兴上述道吐称:“DeepSeek做的事宜很嚣张。不单是Meta,OpenAI、谷歌和Anthropic都由于他们而火烧屁股。这是一件好事,咱们能够睹证公然比赛对革新的促进感化。”

  也许是由于感觉到了比赛压力,Meta的CEO马克·扎克伯格(Mark Zuckerburg)于24日正在旗下社交平台上显露,公司准备正在2025年投资600亿至650亿美元用于资金开销,并准备大幅扩张AI团队。到2025年年终,Meta将具有超出130万个GPU。扎克伯格称“本年将是AI的枢纽一年”,公司还将正在途易斯安那州设立一座价格100亿美元的数据中央。