不仅开源还便宜好用硅谷员工直呼“火烧屁股”的DeepSeek大模型强在哪

　　邦产大模子公司深度求索（DeepSeek）颁发的最新AI（人工智能）大模子正在海外惹起开拓者和投资者的热议。

　　1月20日，量化巨头幻方量化旗下大模子公司DeepSeek正式颁发推理大模子DeepSeek-R1。举动一款开源模子，R1正在数学、代码、自然讲话推理等职业上的本能不妨比肩OpenAI o1模子正式版，并采用MIT许可订定，增援免费商用、肆意改正和衍生开拓等。目前，正在海外大模子排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名依然升至全种别大模子第三，与OpenAI的ChatGPT-4o最新版并列，并正在格调把握类模子（StyleCtrl）分类中与OpenAI的o1模子并列第一。

　　更令商场吃惊的是，据DeepSeek先容，R1的预锻炼用度只要557.6万美元，正在2048块英伟达H800 GPU（针对中邦商场的低配版GPU）集群上运转55天告终，仅是OpenAI GPT-4o模子锻炼本钱的不到异常之一。DeepSeek显露，R1正在后锻炼阶段大周围操纵了深化练习技能，正在仅有极少标注数据的状况下，极大提拔了模子推理才具。别的，DeepSeek不单将R1锻炼技能全数公然，还蒸馏了6个小模子向社区开源，愿意用户借此锻炼其他模子。

　　已经推出，DeepSeek-R1便依据其“物美价廉”的特质正在海外开拓者社区中激励了惊动。正在API订价方面，DeepSeek R1任职对每百万输入token收取0.55美元，对每百万输出token收取2.19美元/百万，而OpenAI最新版o1模子的相应收费分辨为15美元/百万和60美元/百万。正在海外AI社区中小着名气的磋商者Shubham Saboo显露，举动一款“100%开源”的模子，R1比OpenAI o1低贱96.4%，同时供应近似的本能，发起依然订阅ChatGPT的开拓者“放弃浸没本钱”。

　　除了本能方面的出色出现外，DeepSeek还给出了新的AI大模子搭修思绪。英伟达高级磋商科学家Jim Fan显露，DeepSeek-R1或许是“首个浮现了RL（深化练习）飞轮能够阐明感化且能带来延续增加的OSS（开源软件）项目”。此中，“飞轮”用来描写AI体系中自我深化、正向轮回的进程。DeepSeek的论文显示，分歧于过去AI模子往往依赖于监视微调（SFT，指AI模子通过已标注的数据实行锻炼），R1统统由深化练习驱动，证实了直接深化练习是可行的。

　　Jim Fan写道：“咱们正处于一个诡秘的期间线上，一家非美邦公司正正在践行OpenAI最初的责任，即告竣真正怒放的前沿磋商并让全盘人受益。这种状况实在无法领略。最有文娱性的结果却是或许性最大的结果。”

　　硅谷出名投资机构A16z的共同人、Mistral AI董事会成员Anjney Midha显露：“从斯坦福到麻省理工，DeepSeek-R1简直正在一夜之间成为美邦顶尖大学磋商职员的首选模子。”德邦马克斯·普朗克量子光学磋商所AI科学家试验室认真人马里奥·克伦（Mario Krenn）也盛赞DeepSeek-R1的怒放性，比拟之下，OpenAI旗下的模子“素质上都是黑箱”。

　　依据极低的锻炼本钱，DeepSeek-R1也让华尔街和投资者觉得了动摇。1月24日，参投过OpenAI、Databricks、Character.AI等出名企业的危机投资巨头安德森·霍洛维茨基金（Andreessen Horowitz）的协同创始人马克·安德森（Marc Andreesen）连转了几篇合于Deepseek-R1的推文，并对其实行了公然称道。他正在X（原推特）平台上写道：“Deepseek R1是我睹过的最令人咋舌和印象长远的冲破之一——举动开源项目，它是对全邦的一份长远奉送。”

　　随后，法邦企业家、推特定睹首领阿诺德·贝特朗（Arnaud Bertrand）转发了安德森的推文，并称中邦AI的成长速率令人惊艳：“Deepseek功夫不单是合于AI的，而是让全邦认识到中邦正在技能和革新方面依然领先了美邦，而且正在某些范围乃至超出了美邦，假使有人竭力不准这种状况的产生。”

　　正在克日举办的2025年达沃斯论坛上，AI科技草创公司Scale AI创始人亚历山大·王（Alexandr Wang）显露，DeepSeek的AI大模子本能“大致与美邦最好的模子相当”。昨年12月，DeepSeek颁发上一代模子V3后，Alexandr Wang就正在X平台上评判道：“DeepSeek-V3带给外界的教训是：当美邦人正在苏息时，中邦人正在管事，并以更低贱、更疾、更强的产物奋起直追。”

　　而Meta首席AI科学家杨立昆（Yann LeCun）指出，比起“中邦AI超越了美邦”的见解，DeepSeek-R1更紧急的是证实了“开源模子正正在超越专用模子”：“DeepSeek得益于开源磋商和开源项目（比如PyTorch和来自Meta的Llama）。这便是怒放磋商与开源的力气。”

　　1月26日，360创始人周鸿祎发视频道“中邦大模子DeepSeek反超GPT”，称中美AI比赛“最终必定是中邦告捷”，就像中邦依然正在修设业范围打败了美邦：“DeepSeek这家公司迩来的出现实在逆天，我信赖畴昔倘使要抗拒美邦的AI技能霸权，中邦大模子技能复仇者同盟战队里必定有DeepSeek的一份，由于这家公司和它的创始人万分低调，他们技能才具和将来前景被商场主要低估了。”

　　同时，商场初步猜度，DeepSeek-R1的横空出生是否会影响一味“砸钱”参加AI竞赛的美邦科技巨头们。阐发指出，AI行业比赛或将以比料思中更疾的速率加剧，并有或许影响到上逛AI硬件企业的收入。

　　加州大学伯克利分校的AI策略磋商员Ritwik Gupta显露，DeepSeek-R1的产生证实了“AI才具没有技能护城河”，并称“中邦的体系工程师人才库比美邦大得众，他们懂得奈何富裕运用估量资源来更高效地锻炼和运转模子”。

　　1月23日，一名Meta员工正在匿名职场论坛Teamblind上发帖称，Meta内部依然由于DeepSeek-R1而进入“着急形式”。这位员工写道：“Meta的工程师们正正在分秒必争地阐发DeepSeek，试图复制此中一起或许的技能，照料层正为天生式AI研发部分的巨额参加而忧愁。”

　　该员工显露，DeepSeek-R1的锻炼本钱不到550万美元，而Meta的天生式AI部分里“每位引导的薪资都超出了这个数字”：“（AI部分）本应是一个以工程为中枢的小型构制，但由于许众人都思进来分一杯羹，人工膨胀了构制的周围，结果人人都是输家。”

　　随后，有认证为谷歌员工的网友复兴上述道吐称：“DeepSeek做的事宜很嚣张。不单是Meta，OpenAI、谷歌和Anthropic都由于他们而火烧屁股。这是一件好事，咱们能够睹证公然比赛对革新的促进感化。”

　　也许是由于感觉到了比赛压力，Meta的CEO马克·扎克伯格（Mark Zuckerburg）于24日正在旗下社交平台上显露，公司准备正在2025年投资600亿至650亿美元用于资金开销，并准备大幅扩张AI团队。到2025年年终，Meta将具有超出130万个GPU。扎克伯格称“本年将是AI的枢纽一年”，公司还将正在途易斯安那州设立一座价格100亿美元的数据中央。

相关文章