12月5日,腾讯正式揭橥了其自研AI大模子混元2.0(Tencent HY2.0),这是继Hunyuan-T1之后的一次紧要升级。HY2.0正在参数范畴、推理材干以及行使场景上均有明显晋升,符号着腾讯正在AI界限的不断革新与前进。
HY2.0采用搀和专家(MoE)架构,总参数高达406B,激活参数为32B,赞成256K的上下文窗口。这种架构策画不只晋升了模子的推理材干和效能,更使得HY2.0正在邦内AI大模子界限中处于领先职位。按照腾讯的声明,HY2.0正在文本创作、繁杂指令恪守等适用场景中体现非常,呈现了宏大的行使潜力。
正在数据预教练和加强练习战略方面,HY2.0Think相较于前一版本有了明显改革。腾讯通过高质地的数据集以及Large Rollout加强练习,使得HY2.0正在繁杂推理场景中的体现稳居邦内第一梯队。出格是正在邦际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等巨子测试中,HY2.0Think赢得了优异成就,显示出其正在数学和科学常识推理方面的宏大材干。
正在指令恪守和众轮职业的材干上,HY2.0通过紧要性采样改进技巧,处置了教练和推理不类似的题目,告竣了长窗口RL的高效安定教练。其它,模子采用了众样化的职业沙盒和基于打分规矩的加强练习,明显晋升了正在MultiChallenge等指令恪守职业中的体现。
正在代码和智能体材干方面,HY2.0修筑了范畴化的可验证处境及高质地合成数据,加强了模子正在Agentic Coding及繁杂用具挪用场景下的实践行使材干。过程测试,HY2.0正在SWE-benchVerified和Tau2-Bench等可靠行使场景的智能体职业上体现卓着,显示出其正在实践行使中的渊博实用性。
值得细心的是,HY2.0Think引入了细密的长度责罚战略,有用平均了头脑链的效能与成绩,避免了模子输出冗余音讯,告竣了策动资源的更高效分拨。按照对照,HY2.0正在IMO-AnswerBench、HMMT2025、ARC-AGI、Humanitys Last Exam(HLE)等巨子推理职业中的体现,显示出正在犹如切确率下,HY2.0的token泯灭明显低于其他模子,展现了其正在智能密度上的行业领先秤谌。
通过RLVR+RLHF双阶段的加强练习战略,HY2.0的输出质地有了明显晋升,正在文本创作、前端拓荒和指令恪守等实践行使场景中呈现出分明的上风。与前版本比拟,HY2.0正在指令恪守方面的切确率有了分明晋升,进一步结实了其行为腾讯自研通用大模子的职位。
来日,腾讯将不断对HY2.0实行迭代升级,要点眷注代码、智能体、特性化气概和长程追念等对象,周全晋升模子正在实践行使中的体现。同时,合系技巧和模子也将以开源方法向社区绽放,进一步激动AI技巧的发扬与行使。
目前,HY2.0依然率先正在腾讯的元宝和ima等原生AI行使中接入,并正在腾讯云上线API,用户能够直接体验或接入安插。跟着HY2.0的推出,腾讯正在AI界限的革新步骤将不断加快,为各行业的智能化转型供给强有力的技巧赞成。返回搜狐,查看更众