2026年DeepSeek:加速迭代的开源大模型引领者(附下载)

  DeepSeek:引颈开源大模子成长,重塑环球 AI 成长格式。深度求索 (DeepSeek) 于 2023 年 7 月正式建树,由梁文锋旗下的量化投资机构幻方量化设立,潜心于 AI 大措辞模子的拓荒。2025 年 1 月 20 日,推理模子 DeepSeek-R1 依据更低的 陶冶本钱以及领先的模子本领,长远影响了环球 AI 工业成长,R1 颁发后 1 周内 DeepSeek App 告终用户数增加超 1 亿。DeepSeek 络续以算法优化和工程立异 加快 AI 本事平权,基于 OpenRouter 平台数据,2024 年 11 月至 2025 年 11 月 时代,DeepSeek 的累计移用量为 14.37 万亿 Token,位居环球开源大模子榜首。

  DeepSeek V 系列器重本钱出力,R 系列器重推理功能。DeepSeek V 系列模子 为根柢模子,器重本钱及推理出力的优化;R 系列为推理模子,基于 V 系列根柢 模子实行后陶冶,明显提拔了模子正在数学、代码天生、繁复逻辑推理等职业中的 出现。 1)模子方面:2024 年 1 月,公司颁发首个大模子 DeepSeek LLM 67B 通用大 措辞模子。2024 年 5 月,公司推出 DeepSeek-V2,基于 MoE 架构,大幅提 升模子训推出力,API 订价消重至 GPT-4 Turbo 的百分之一。2024 年 12 月, 公司推出 DeepSeek-V3,陶冶本钱仅 557 万美元,功能出现比肩 GPT-4。 2025 年 1 月,公司颁发推理模子 DeepSeek-R1 正式版,推理功能比肩 GPTo1。2025 年往后,DeepSeek 推绝伦个迭代版本,数学、推理、长上下文、 众模态等方面的本领络续提拔。 2)产物方面:DeepSeek-R1 颁发鼓动 DeepSeek App 灵活用户数火速增加。 DeepSeek App 上线 天环球日活 DAU 抵达 2161 万,成为当时环球增速 最疾的 AI 行使。依据 Questmobile 数据,DeepSeek App 2025 年周灵活用 户范围位各邦内 AI 原生 App 第二,抵达 8156 万。

  机合架构扁平,最大化开释部分立异本领。自建树往后,公司以拓荒真正的通用 人工智能(AGI)行为主意,寻觅模子的底层立异而非火速实行 AI 行使的贸易化 变现。DeepSeek-V3 本事陈述的伸谢一面显示,共有 139 名工程师出席了项目, 公司机合架构扁平,内部不存正在层级和跨部分修设,看待算力资源、人力资源的 移用极端矫捷。 搜集邦内顶尖高校人才,团队年青化。DeepSeek 的创始人梁文锋是九章资产、 幻方量化两家百亿量化私募的创始人及实质限制人,公司的工程师和研发职员几 乎都来自清华大学、北京大学、中山大学、北京邮电大学等邦内顶尖高校,鲜少 有海外布景。团队高度年青化,以应届和结业 1-2 年的人工主,亦有不少博士正在 读生。

  股权构造方面,梁文锋具有绝对限制权。1)股权方面,梁文锋直接和间接限制深 度求索约 84%的股权。2)限制权方面,梁文锋持股宁波程普有限公司 68.21%的 股权,具有绝对限制权;宁波程普为宁波程信和宁波程恩的日常联合人(GP), 具有实质决定权;通过以上格式,梁文锋告终了对深度求索的限制。3)激劝方面, 宁波程信行为股权激劝平台,其行为宁波程恩的有限联合人 (LP),具备分红权。

  DeepSeek V 系列、R 系列络续迭代,模子本领稳步提拔。深度求索遵守恒久主 义,不追赶短期贸易好处,变成 “不融资、不盲从、死磕 AGI”的奇特范式。2024 年 12 月,公司推出 DeepSeek-V3 模子,模子总参数范围抵达 671B,基于 MoE 架构优化以及 MLA 本事等,告终了模子陶冶本钱大幅低落、推理出力大幅提拔。 2025 年 2 月,基于 DeepSeek-V3-base 根柢模子及大范围深化练习,公司颁发 并开源推理模子 DeepSeek-R1,功能对标 OpenAI-o1,推理本钱仅为 OpenAI-o1 的约 1/30。2025 年,公司 V 系列、R 系列模子实行了众次小版本迭代,正在长文 本、数学、编程及通用推理、Agent 等方面的本领络续提拔。