2026年DeepSeek：加速迭代的开源大模型引领者（附下载）

　　DeepSeek：引颈开源大模子成长，重塑环球 AI 成长格式。深度求索（DeepSeek）于 2023 年 7 月正式建树，由梁文锋旗下的量化投资机构幻方量化设立，潜心于 AI 大措辞模子的拓荒。2025 年 1 月 20 日，推理模子 DeepSeek-R1 依据更低的陶冶本钱以及领先的模子本领，长远影响了环球 AI 工业成长，R1 颁发后 1 周内 DeepSeek App 告终用户数增加超 1 亿。DeepSeek 络续以算法优化和工程立异加快 AI 本事平权，基于 OpenRouter 平台数据，2024 年 11 月至 2025 年 11 月时代，DeepSeek 的累计移用量为 14.37 万亿 Token，位居环球开源大模子榜首。

　　DeepSeek V 系列器重本钱出力，R 系列器重推理功能。DeepSeek V 系列模子为根柢模子，器重本钱及推理出力的优化；R 系列为推理模子，基于 V 系列根柢模子实行后陶冶，明显提拔了模子正在数学、代码天生、繁复逻辑推理等职业中的出现。 1）模子方面：2024 年 1 月，公司颁发首个大模子 DeepSeek LLM 67B 通用大措辞模子。2024 年 5 月，公司推出 DeepSeek-V2，基于 MoE 架构，大幅提升模子训推出力，API 订价消重至 GPT-4 Turbo 的百分之一。2024 年 12 月，公司推出 DeepSeek-V3，陶冶本钱仅 557 万美元，功能出现比肩 GPT-4。 2025 年 1 月，公司颁发推理模子 DeepSeek-R1 正式版，推理功能比肩 GPTo1。2025 年往后，DeepSeek 推绝伦个迭代版本，数学、推理、长上下文、众模态等方面的本领络续提拔。 2）产物方面：DeepSeek-R1 颁发鼓动 DeepSeek App 灵活用户数火速增加。 DeepSeek App 上线天环球日活 DAU 抵达 2161 万，成为当时环球增速最疾的 AI 行使。依据 Questmobile 数据，DeepSeek App 2025 年周灵活用户范围位各邦内 AI 原生 App 第二，抵达 8156 万。

　　机合架构扁平，最大化开释部分立异本领。自建树往后，公司以拓荒真正的通用人工智能（AGI）行为主意，寻觅模子的底层立异而非火速实行 AI 行使的贸易化变现。DeepSeek-V3 本事陈述的伸谢一面显示，共有 139 名工程师出席了项目，公司机合架构扁平，内部不存正在层级和跨部分修设，看待算力资源、人力资源的移用极端矫捷。搜集邦内顶尖高校人才，团队年青化。DeepSeek 的创始人梁文锋是九章资产、幻方量化两家百亿量化私募的创始人及实质限制人，公司的工程师和研发职员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等邦内顶尖高校，鲜少有海外布景。团队高度年青化，以应届和结业 1-2 年的人工主，亦有不少博士正在读生。

　　股权构造方面，梁文锋具有绝对限制权。1）股权方面，梁文锋直接和间接限制深度求索约 84%的股权。2）限制权方面，梁文锋持股宁波程普有限公司 68.21%的股权，具有绝对限制权；宁波程普为宁波程信和宁波程恩的日常联合人（GP），具有实质决定权；通过以上格式，梁文锋告终了对深度求索的限制。3）激劝方面，宁波程信行为股权激劝平台，其行为宁波程恩的有限联合人（LP），具备分红权。

　　DeepSeek V 系列、R 系列络续迭代，模子本领稳步提拔。深度求索遵守恒久主义，不追赶短期贸易好处，变成 “不融资、不盲从、死磕 AGI”的奇特范式。2024 年 12 月，公司推出 DeepSeek-V3 模子，模子总参数范围抵达 671B，基于 MoE 架构优化以及 MLA 本事等，告终了模子陶冶本钱大幅低落、推理出力大幅提拔。 2025 年 2 月，基于 DeepSeek-V3-base 根柢模子及大范围深化练习，公司颁发并开源推理模子 DeepSeek-R1，功能对标 OpenAI-o1，推理本钱仅为 OpenAI-o1 的约 1/30。2025 年，公司 V 系列、R 系列模子实行了众次小版本迭代，正在长文本、数学、编程及通用推理、Agent 等方面的本领络续提拔。

相关文章