DeepSeek登《Nature》封面梁文锋带队首次回应争议

　　2025年9月17日，属于中邦人工智能的又一个高光期间来到了。DeepSeek-AI团队梁文锋及其同事正在《自然》杂志宣告了闭于开源模子 DeepSeek-R1 的探求效果，并登被骗期封面。

　　论文指出，狂言语模子（LLM）的推理才干可能通过纯深化研习明显晋升，从而删除对人工标注的依赖。与古板操练办法比拟，这一举措提拔出的模子正在数学解题、编程竞赛以及涉及STEM界限探求生程度的题目上，均映现出更优的再现。

　　正在此，DeepSeek也初度回应“蒸馏”争议，正在与审稿人的相易中，DeepSeek昭彰外现，R1并非通过复制OpenAI模子天生的推理示例来研习。只是和大大都其他狂言语模子雷同，R1的根源模子是正在搜集上操练的，以是它会摄取互联网上已有的AI天生的内容。

　　正在AI全邦，有一个残酷的共鸣：顶尖大模子的门槛，历来不是算法，而是本钱。OpenAI操练GPT-4，外界估算其花费正在1亿美元以上；谷歌、Anthropic、Meta也正在数万万美元级另外预算上张开竞赛。资金与算力，成了决心话语权的焦点。

　　然而，DeepSeek打垮了这一“潜正派”。依据探求团队正在论文添补资料披露的细节，DeepSeek-R1的推理本钱仅为29.4万美元，低到惊人。即使加上约600万美元的根源模子操练开销，全体本钱仍然远低于外洋巨头。

　　探求团队正在《Nature》宣告的论文中指出，他们采用了纯深化研习（RL）框架，并引入组相对政策优化（GRPO）算法，仅凭据最终谜底的无误与否赐与赏赐，而非让模子步武人类推理道途。

　　令人不测的是，这种看似“粗放”的操练办法，却让模子正在履行中自然显现出自我反思（reflection）、自我验证（self-verification）以及天生更长推理链条（long chains of thought）等高级作为，有时以至会天生成百上千个token来再三琢磨一个题目。

　　这一点正在数学测试中尤为分明。论文数据显示，正在美邦数学邀请赛（AIME 2024）中，DeepSeek-R1-Zero的凿凿率从15.6%跃升至77.9%，正在操纵自洽解码（self-consistency decoding）后更到达86.7%，横跨了人类均匀程度。

　　《Nature》评论称，这证据模子也许正在没有人类推理树范的情形下，通过深化研习自决酿成丰富的思想形式。

　　正在后续的众阶段优化中（网罗RL、拒绝采样、监视微调及二次RL），最终版本的DeepSeek-R1不但正在数学和编程等硬核使命上再现出色，还正在写作、问答等通用使命上映现了流通性和同等性。这意味着，DeepSeek并不是正在“教AI推敲”，而是正在“让AI学会己方推敲”。

　　除了技巧层面的打破，DeepSeek-R1的获胜背后，更有一段鲜为人知的搏斗故事。梁文锋，1985年出生于广东湛江一个日常家庭，父亲是小学教员。他的滋长轨迹虽不为大家熟知，却正在细节中体现出早期的求知与坚忍。

　　2002年，17岁的梁文锋考入浙江大学电子新闻工程专业；五年后，他陆续攻读新闻与通讯工程硕士，师从项志宇，潜心机械视觉探求。恰是正在硕士阶段，他与同窗测验将机械研习使用于金融商场，寻求全自愿量化买卖——那一年，环球金融风险正正在囊括全邦。即使机缘许众，像大疆创始人汪滔曾邀请他配合创业，梁文锋却拔取了一条少有人走的道：信任人工智能将蜕变全邦，他决心独立创业。

　　硕士结业后，梁文锋先是将人工智能技巧与量化买卖集合，树立雅克比投资及幻方科技，并正在十余年间稳步生长。直到2023年，他将眼神转向通用人工智能，树立DeepSeek，开启了AI大模子研发之道。仰仗对算法和本钱效劳的双重闭心，DeepSeek正在短短两年内连气儿发外V2、V3模子，不但拉低了邦产大模子的推理本钱，更以惊人的性价比轰动了环球商场。

　　梁文锋对团队树立的理念同样非同寻常。他争持“才干为先”，焦点岗亭众由应届结业生和阅历仅一两年的年青人构成，“咱们可能不是正在中邦找到前50名顶尖人才，但咱们可能己方提拔。”这种信奉，也恰是DeepSeek也许正在低本钱下完毕高推理才干的要害。

　　现正在来看，DeepSeek的这项探求，其代价远不止于一个职能健旺的模子。它更像是一份“举措论宣言”，向全邦浮现了一条不依赖天量标注数据、更具可接续性的AI进化之道。它打垮了“资金即壁垒”的魔咒，将AI生长的主动权交还给了科学革新自己。

　　这不但仅是中邦AI的高光期间，更是环球AI迈向“推理革命”的一个紧要里程碑。Nature审稿人、Hugging Face机械研习工程师Lewis Tunstall以为，“R1开启了一场革命”。越来越众正正在使用R1的举措论改正现有的狂言语模子。

　　另日的AI角逐，很不妨将从“数据与算力的军备竞赛”，转向“算法与聪慧的革新竞赛”。而DeepSeek-R1，依然为这场新竞赛吹响了军号。返回搜狐，查看更众

相关文章