「理想同学」的进化史:从AI助手到智能体的自研之路

  “冰箱彩电大沙发”是理念最被人所知的卖点。但掷开这些精准的硬件界说,行为异日用户智驾空间与文娱的第三空间,座舱里只要这些是远远不敷的。智能化特别是座舱空间的智能化,曾经成为车企的中央卖点。

  2023年5月,理念汽车智能空间副总裁勾晓菲曾正在美邦硅谷的一次半公然宣讲会上说,“触控不是座舱最合键的交互方法,把触控做得再好,生态做得再好,它不适合正在这个终端里。基于触控生态的车机编制,即是正在用确切的方法回复了一个舛误的题目。”

  勾晓菲这句话说完后的一个月,理念汽车推出了自研认知大模子“Mind GPT”,并将其以“理念同窗”App的方式嵌入车机编制中,成为座舱里浩瀚用户与数字内容交互的“新按钮”。

  大模子加快上车后,智能座舱的竞赛更显白热化。行为全公司最大的产物司理,李念对付AI的加入格外倔强,每个月都邑列入数场AI的焦点会。

  他时常说的一句话是:“咱们是一个AI公司,咱们必需把大模子做出来,没有大模子就不配称为AI公司。”

  李念不是技艺科班身世,但正在2024年6月,他做了一件格外具有“预言性”的事变:大模子的筹议重心,要从预熬炼向后熬炼转移。三个月后,OpenAI o1惊艳众人,后熬炼(Post-Training) 正在大模子端到端熬炼中的话题度接续晋升。而正在李念此前的授意下,理念曾经提行进行了内部共鸣和结构的切换。

  回首史乘,正在2021年2月扫数自研之前,理念的语音助手还需求依赖思必驰、地平线、大象声科等供应商来支柱,乃至“用户数据”都还握正在别人手中。从古代的AI助手到大模子期间下的智能体,理念通过“理念同窗”,杀青了一次座舱“自我革命”的重修。

  2020年,正在交付一万辆车一个月后,理念汽车正在美股上市。理念祈望通过开发和完满自研才略,尽疾追逐上竞赛敌手小鹏。然而,理念汽车内部算法团队和供应商的博弈中处于劣势。这让李念敏锐地认识到,倘使没有自研才略,就会无间被羁绊。

  扫数启动自研之前,理念的座舱技艺“一贫如洗”,更众依赖供应商,比方思必驰的语音识别、大象声科的听觉算法、虹软的视觉才略等等。座舱方面还没有昭彰的途径图,团队怎样摆设、产物怎样界说、技艺途径怎样走,没有一个懂得的结论。

  2021岁尾,李念正在智能空间大部分的策略会上,昭彰智能空间与AI合系的悉数算法都要自研,之前底层算法依赖于供应商的步地必需被打垮。与此同时,理念内部正正在力推两件事变:一个是IPD流程,将全数人的职责绑定正在流程上;二是促进研发平台的摆设。

  理念的座舱平台化战略是通过SS1、SS2、SS3、SS4等差别平台来杀青,每个平台基础上对应一款车型。因为理念的车型打算宛如,组织上也相对可控。对付研发团队而言,最具挑拨性的是麦克风和摄像头传感器的构造,这些构造直接影响算法的开荒。于是,轨范化的设备单,只会有“一份菜单”,避免了定制化的资源耗费。

  2022年,理念汽车规划只公布一款L9,到2023年L9、L8、L7系列车型同时上市。倘使两年后才切回自研,理念可以会错失市集时机。正在无法预知蔚来、小鹏、华为等敌手迭代速率的景况下,切换供应商的历程被缩短到了一年。

  2022年的前半年内,从搜狗参加的陈伟掌握组修空间AI团队,成员既有来自搜狗的老同事,也有百度、疾手、字节、阿里达摩院等互联网大厂成员。

  与搜狗等互联网公司比拟,理念仍没分离车企的“草泽”气质——没有架设云端任职器,乃至连基础的职责站也没有,用户的数据全正在语音技艺供应商思必驰手中。

  与此同时,因为成员靠山众元,团队需求昭彰异日的发达倾向,神速晋升这支团队的战争力,只可静心于主线职责。有座舱AI同事张江纪念:“咱们获得的倾向是戮力静心于自研,恶果要比供应商好30%。”

  其次,正在团队没有成型时,空间AI团队悉数实行扁平化治理,确保新闻疏导足够神速。要打垮从大厂可以带来的部分墙头脑,通过流程和轨制的转折来处分配合题目,让更众人神速融入团队。

  理念全数的高层,都对座舱的推动维系了高度合怀。座舱自研之初,空间AI团队设念的一种发达旅途是,异日一到两年内,让理念同窗的AI才略可能掩盖车、门店、客服等等场景。

  但据另一位理念座舱员工孙浩纪念,有一次李念列入了座舱团队的LSA策略分解会。会后,李念给了一个结论:不要把目前曾经成熟的计划重做一遍。

  “智能客服这种事,值不值得做,倘使你能费钱买过来,你就去买,你不要再让团队再去支柱如许交易。咱们这个团队是把理念同窗的产物力度做好,处分车内交互的题目。”

  完毕资源切换后,功劳很疾呈现。与供应商计划比拟,自研技艺的车内阐扬有了本色性的打破,用户能感觉到语音支配的便捷性获得了明显晋升,交互体验变得更贯通自然。

  比及理念L7首发的时期,搭载其上的语音和视觉功用曾经悉数是自研技艺。2023年上半年,理念基础完毕了座舱自研技艺的切换,彻底离开对外部供应商的依赖。

  理念座舱团队此行进行了极少预熬炼职责,对大模子的到来有预判,但没念到模子能发达到这样大的界限。当时,座舱的自研技艺切换还没有完毕,OpenAI依旧实行闭源,没有人知晓大模子应当怎样做。

  正在大模子崭露前,语音交互合键是敕令式或职责型的,行业竞赛更众会集正在语音识其余速率、实践的正确性和呼应出力上。但那时期的AI助手认知才略还是亏损,特别正在丰富职责体会、常识问答、绽放式对话上存正在局部,这也限制了理念同窗的产物力。

  李念把座舱团队的高管叫上开会,他给了一个己方的结论:ChatGPT对财产影响是摧枯拉朽的,全数人都正在合怀AI助手的语音识别速率、圆活度和正确率,但这种东西永久卷不出来。从用户体验的角度来看,没有大模子的加持,这些目标只是低维度的竞赛。

  从这个时期着手,AI成为李念提及最高频的词之一。两个月后,理念对内宣告,理念的愿景是“2030年,成为环球领先的人工智能企业”。固然这一愿景后续有所转折,但理念汽车曾经不再局部于“车企”的定位。

  此时,大模子与座舱空间怎样联合、处分什么题目,没有任何可参考的样本,需求座舱团队己方重新探索。

  可这不影响李念对大模子倔强的立场,他乃至恳求属员们到场“对赌”,还要讲认识可能怎样运用大模子知足用户,以及昭彰的交付时期点。

  当时,全数人都没有统统理解这应当被称为“智能体”,但团队曾经以为大模子是一种样子——行为大脑,可能维系百般器材和影象、步履的组件。

  2023年4月,座舱团队向李念举行了一次报告,并为它起好了名字--Mind GPT。两个月之后,理念的空间AI团队就交出了第一个版本——6月7日,家庭科技日行动上,李念对外说明了大模子MindGPT的存正在。

  他外现,Mind GPT操纵了1.3万亿token,举行基座模子熬炼,这相当于它具备了人类高质地常识的总和。当时,理念曾经基础确定了场景,合键会集正在出行文娱、用车以及儿童教导,还是是盘绕家庭用户的需求做作品。

  这些需求正在内部被称为“三助一师”,涵盖了用户用车助手、出行助手、文娱助手及百科教师四个脚色,理念乃至为这个新名词注册了众个招牌。

  其后,空间AI团队又定下了2023岁尾大模子上车的新倾向。全部团队不单要完毕从0到1的大模子全链途技艺打破,更要从0到1完毕将大模子赋能给理念同窗。

  过去,空间AI团队成员合键擅长开荒功用简单、倾向昭彰的小模子,现正在却要转向研发功用丰富、需求接续升级的大模子,并最终安放到汽车上,这自己就极具挑拨。更况且,当时的开源资源并不充溢。

  大模子期间不单技艺门槛高,其配合方法也爆发了根蒂转折。全部研发流程涉及预熬炼、后熬炼、评估等众个症结,需求熬炼、数据、底层工程等众方面才略的严密配合,怎样合理切割阶段成为症结,切得太细配合低效,太粗人力亏损古代的“伐胀传花”式研发逻辑,每添补症结就导致出力降落和不成控性的上升。

  这意味着,座舱AI团队需求盘绕大模子从新界说症结岗亭和脚色,摒弃过去习气的古代互联网大厂研发旅途,正在同时推动大模子基座、熬炼算法研发的同时,确保产物正在百般车载场景下的体验。

  险些每周,理念都邑对Mind GPT举行一次版本迭代,并同步集成到“理念同窗”中举行升级,涉及与已有模块的联动和新战略的联调。为了确保每次升级都能带来体验安祥晋升,上线之前团队都需求举行人工标注和测试验证。

  据理念座舱团队的张栋纪念,“李念是一个格外首肯给资源的人。2023年,李念时常恳求座舱AI团队大胆提出资源或者算力的需求。预算上直接批了三四千张卡(芯片)的资源,团队累计具有近八千张卡。”

  2023年9月,座舱AI团队还推出“方言自正在说”功用。更令团队觉得兴奋的是,众模态互动的落地,让手势支配进入座舱成为可以。正在车内,用户只需顺手一指,就能轻松支配车窗、空调、灯光乃至影音文娱。

  2023岁尾,Mind GPT跟着OTA 5.0版本更新胜利“上车”,并通过邦度大模子挂号,是较早现实操纵于车端的大讲话模子之一。正在Mind GPT加持之下,理念同窗可能体会更为丰富的功用组合,用户交互更自然。

  这个委员会里,搜罗产物部和各个研发部分的掌握人及合键职员,目标是对异日的技艺途径举行评审和占定,以及对技艺投资举行决定。

  好比,断定是否正在某个项目上立项。理念有一个面向筹议的RD预算池,这个池子的资金分拨,很大水准上就由技艺委员会举行技艺评审。

  2024春季公布会上,理念推出首款纯电车型MEGA;一个月后,公司启动结构升级,CEO办公室更名“产物与策略群组”,设立产物线和质地运营两个新部分。

  李念曾将OpenAI界说的闲聊机械人以为是第一阶段,第二阶段是推理者,而进入上述时辰的第三阶段是崭露Agent,理念要做的即是将汽车行为载体杀青AGI的Agent阶段。

  2024年10月,理念秋季策略会上,车机端的理念同窗的交易优先级由最上下落两级,陈伟正在2025年头被调任基座模子部分掌握人,主导基座模子自研。

  基座模子是蔚小理等新权力夺取AI期间的一张门票。本年4月,小鹏智驾掌握人李力耘曾外现,小鹏目前曾经入手下手推动72B超大界限参数寰宇基座模子的研发。

  据基座团队向雷峰网反应,内部不会寻找一个超大界限的基座,要联合加入产出比以及场景联合度。(后续,雷峰网还将推出理念端到端、基座模子、芯片等自研话题,感有趣的读者可增加编辑微信 Gru1993 互通有无)

  参加理念前,谢炎曾正在华为职责三年,时刻升任消费者BG软件部副总裁、终端OS部部长,他还曾行为AliOS首席架构师正在阿里巴巴职责五年。与更偏重产物的勾晓菲差别,谢炎将精神合键放正在根基办法和底层技艺的研发上。

  2025年4月16日,理念汽车正式宣告开源理念星环OS,成为环球首家开源整车操作编制的车企。李念正在微博上外现,开源的理念星环OS可能助助任何一个品牌每年俭省万万乃至上亿的本钱。

  目前来看,理念要核心打制两款人工智能产物,理念同窗用以杀青Agent和自愿驾驶用以杀青L4级其余自愿驾驶,而且基座模子发达到结尾阶段会协调成VLA模子。于是,基座模子被理念高层寄予了更高的希望。