发布日期: 2025-08-01
2025年7月26日,全邦人工智能大会时期,光荣正式揭橥邪法大模子家族新成员——MagicGUI大模子,并发布开源。这款参数领域达70亿的模子首要控制众模态感知和主动化实践,更成为其首个GUI开源大模子。目前,该模子的本领呈报已登岸GitHub平台,模子参数和光荣测试集将于近期上线,向庞大软硬件开垦者怒放。
该模子正在比肩SOTA模子的同时,光荣更始性应用连接预锻练、深化微调的两阶段锻练法子,打破行业本领瓶颈,正在大模子援助场景的通用和泛化上赢得了打破性发达。这一更始不光标记着光荣正在 AI 底层本领规模的阶段性打破,更折射出智能终端行业正在通用人工智能海潮下的生态化转型思绪。
与古板侧重“常识天生”的言语大模子分别,MagicGUI大模子聚焦“屏幕感知+活动实践”中枢才略,直指“AI智能体(Agent)”这一更为庞大的本领赛道——通过众模态感知解析屏幕内容、以主动化实践竣工操作指令,告竣从用户贪图到职责结果的闭环。
以上打破使得单智能体实践向众智能体协同竣工庞大职责成为恐怕,正如光荣MagicOS首席产物官王皑所言,MagicOS已具备“众模态感知、性子化推理、生态化器械和主动化实践”全链途的智能体才略。
行动光荣本年提出的“阿尔法战术”的枢纽里程碑,MagicGUI大模子的揭橥并开源承载着主要战术事理。该战术旨正在胀动光荣从智高手机缔制商向AI终端生态公司转型,而MagicGUI修筑的本领基座,既为自己智能体营业供应底层支持——如已正在Magic V5旗舰机上告竣“万事找YOYO”的全新智能体体验,也为跨设置协同、众场景调和、AI生态发达奠定底子,助力“修筑灵敏生态”的战术第二步落地,加快告竣“让AI走进存在”的中枢标的。
光荣MagicGUI大模子的推出,设备正在对智能体适用化痛点的长远洞察之上。正在挪动互联网生态中,行使场景碎片化、交互逻辑不同化不绝是限制智能体领域化落地的中枢瓶颈。古板大模子往往依赖特定场景的数据锻练,正在面临未遮盖的行使界面或操作流程时,容易呈现解析差错或实践失效。
针对这一行业共性困难,MagicGUI大模子采用全新的双阶段数据锻练法子告竣本领打破。正如光荣MagicOS首席产物官王皑所说:“当咱们大模子正在遭遇一个没有经由预锻练的新场景时,它仍旧也许很好地适配和援助。这打破了以往的本领瓶颈。” 第一阶段通过大领域通用界面数据锻练,修筑底子交互逻辑框架;第二阶段引入场景转移练习机制,使模子也许从已知场景中提炼秩序,火速适配目生界面境况。这种锻练形式使模子正在未经由专项锻练的行使场景中仍能保留高适配性,较古板法子告竣明显提拔。
正在本领验证层面,MagicGUI 大模子已正在众项通用数据测试中抵达行业领先水准。王皑流露:“MagicGUI大模子正在极少通用数据集的测试当中,依然抵达了比肩 SOTA 行业领先水准的本领验证。” 更具试验代价的是,该模子已得胜行使于光荣最新折叠旗舰机型 Magic V5,支持起 “万事找 YOYO” 这一形象级效力。
王皑以为,用户通过自然言语指令,即可让智能体竣工从打车比价、旅店预订到文档管束的庞大职责,告竣了从 “人适合机械” 到 “机械解析人” 的人机交互范式更动。“以前恐怕是人去适合机械,不过现正在更众的是机械须要去练习人。”
众模态调和才略是 MagicGUI 大模子的另一本领亮点。分别于简单模态的言语或图像模子,该模子告竣了视觉解析与操作实践的深度协同,这与王皑提到的 “AI 智能体的平台行使才略上,根基上具备了众模态感知、性子化推理、生态化器械和主动化实践全链途才略” 相契合。通过视觉大模子解析屏幕内容组织,识别按钮、输入框等交互元素;借助深化练习算法天生最优操作旅途;最终通过模仿点击等格式竣工主动化实践。这种端到端的管束才略,使智能体也许应对页面组织和内容众变、操作流程众变的庞大场景,正在 Magic V5 的现实应用中显露出高效的职责竣工才略。
“咱们正在修筑MagicOS第一天就设思修筑成为怒放的平台,既能够让行业突出的智能体更好地融入到咱们的MagicOS体系当中来,同时也能够把咱们突出的大模子的才略怒放出去,与环球伙伴联合来修筑更发达的AI生态。”王皑以为,正在现时智能体本领加快迭代的窗口期,简单企业的闭环研举事以遮盖千行百业的场景需求。通过开源,光荣正正在修筑一个由软硬件开垦者、行业办理计划供应商联合出席的更始联合体。
从本领共享维度看,MagicGUI大模子的开源内容将包括模子架构、模子参数、光荣测试集等,开垦者可基于 MagicGUI 大模子实行二次锻练,针对特定行业场景优化模子参数,比如智能家居厂商可锻练模子识别家电掌握界面,金融机构能定制化开垦理家产物操作流程。这种模块化的开源战略,既保存了中枢本领的通用性,又为笔直规模更始预留了空间。
生态协同效应正在跨设置场景中尤为明显。据领悟,光荣 MagicOS 已告竣众体系互联互通,而 MagicGUI大模子的开源将进一步突破设置间的操作壁垒。 “从单智能体的调节到众智能的协同来竣工庞大的职责成为了恐怕” 。正在王皑看来,他日用户家里的冰箱、空调、汽车都能够做到无缝的流转——这便是他日发达生态的一个最好展现。这种无缝流转的背后,是联合的界面解析与操作实践准则,而开源恰是胀动这一准则造成的有用旅途。
别的,第三方开垦者的出席正正在充足生态的行使维度。王皑提到,“良众效劳,比方出行、存在、美食、美妆等营业,行动营业的真正供应者是三方。咱们要为用户效劳,但用户的需求必定是众元化的。以是咱们必定要把这些三方纳入到咱们的生态系统内部来,通过咱们的 YOYO 智能体把它整合起来,然后供应最优的体验给到咱们的用户。” 这一理念正通过 MagicGUI 大模子的开源得以试验,吸引稠密行业伙伴参预,联合拓展行使场景,提拔用户体验。
MagicGUI 大模子的推出与开源,正正在激励智能终端行业的连锁响应。正在手机规模,人机交互的逐鹿已从硬件参数比拼升级为智能体才略计较。Magic V5 “一语解千愁”,通过自然言语指令直接挪用庞大效力,这种成果提拔正正在从头界说旗舰机型的用户体验准则,胀动行业向更智能、更便捷的交互格式演进。
跨设置协同规模的改革更为长远。光荣提出的 “灵敏生态” 构想,将 AI 才略从手机延迟至冰箱、汽车、穿着设置等全场景硬件,这是阿尔法战术第二步的主要内容:要修筑一个灵敏生态,把 AI 的才略也许赋能到更众的硬件。MagicGUI 大模子行动这一构想的本领基座,办理了分别设置界面言语不联合的困难,告竣了设置间的无缝协同,让跨场景效劳流转成为恐怕。
通用人工智能(AGI)的成长趋向下,MagicGUI 大模子的组织具有前瞻性。王皑以为:“AI 本领原来是日初月异,他日必定会成长到通用人工智能。通用人工智能的特质是什么?便是它尤其靠拢于人类,更众地像人类一律去思虑题目,去做极少自决的决议。”光荣阿尔法战术的 “三步走” 计议显示了懂得的成长旅途,而 MagicGUI 大模子恰是这一同线图的枢纽支持 —— 其连续进化的解析与实践才略,将为智能体从器械属性向伙伴属性升级供应本领储存。
行业逐鹿的中央正正在发作变动。光荣通过开源MagicGUI大模子,现实上左右了生态创设的主动权,正如王皑所夸大的生态共筑理念,出席此中的硬件厂商、行使开垦者越众,基于该模子的本领生态就越坚固。这种以本领准则为中枢的逐鹿,将胀动行业向更怒放、更协同的宗旨成长。
然而虽然发达明显,GUI大模子也面对众重离间。性子化贪图解析是现时的中枢瓶颈,王皑坦言:“最大的离间,咱们供应的‘千人千面’,原来每个体应用习俗纷歧律,应用手机的习俗也纷歧律,每个体的 IP 属性也纷歧律。举个例子,这种个体化的贪图解析,我以为是最大的离间。” 统一指令正在分别用户语境下恐怕存正在不同,怎么凿凿解析并餍足每个用户的性子化需求,是 MagicGUI大模子及合系智能体本领须要连续打破的难点。
从时机维度看,跟着模子解析才略的提拔,其行使场景将从器械操作向决议援助延迟,正如王皑所预计的,他日 YOYO 智能体将“成为一个有心理代价随同的伙伴。他不光是事务好搭子、存在好搭子,也是正在用户心理有摇动的时分也许供应心理代价、赐与唆使的小伙伴。” 这种从实践层面向认知层面的高出,恐怕催生全新的智能效劳样子,为用户带来更扫数、更知心的体验。
与此同时,MagicGUI 大模子的开源为各行业供应了智能本领底子,将胀动 AI 正在工业、教授、医疗等规模的深度行使,正如王皑所言:“AI 本领打破怎么支持 MagicOS 与智能体成长,以及光荣是怎么让 AI 走进存在场景的。” 这种跨行业的调和行使,不光拓展了模子的贸易代价,也为行业数字化转型供应了新器械,胀动全部社会向智能化宗旨成长。
“第一步,原来咱们便是盼望正在光荣的每一款产物内部都打制具备 YOYO 智能体才略的智高手机,为每一位光荣的用户供应极致便捷的人机交互。第二步,修筑一个灵敏生态。第三步,原来咱们便是假使真正他日全邦抵达了一种通用人工智能的时间,那么咱们的 YOYO 智能体也会同步进化到恐怕是咱们更好的一个数字伙伴,以至是更懂你的数字分身。”王皑说。
短期来看,模子将聚焦于提拔庞大职责的管束才略,进一步优化众轮对话中的贪图改良、跨行使操作的容错机制等,让智能体更凿凿、更牢靠地竣工用户贪图的解析,提拔用户体验的太平性与通畅性。通过连续的本领迭代,使 MagicGUI 大模子正在各式场景下都能保留高效的管束才略,更好地支持 YOYO 智能体的可连续演进。
中期标的是告竣心理感知与共情反映,使智能体正在实践职责的同时,能解析用户的心理状况,供应感情援助。这种心理代价的注入,将是智能体从器械向伙伴进化的枢纽标记,让用户正在应用进程中得回更炎热、更知心的体验。
永久而言,跟着通用人工智能本领的成熟,正在邪法大模子的驱动下,YOYO智能意会逐渐演进成为用户的 “数字分身”。这个时分智能体就相当于是咱们手机里的助理和真正的人类共生共存,从而咱们全部的灵敏全邦就会发作极少很大的转化、具备更大的联思空间它将熟谙用户的活动习俗、代价偏好,以至能模拟用户的思想格式管束事宜,助助用户竣工各式个体化职责,从头界说人与数字全邦的联系。
生态领域的扩充恐怕带来质的奔腾。由切切出席者联合塑制的智能他日,将胀动 AI 本领真正走进存在的方方面面,为用户带来更灵敏、更便捷、更富饶情面味的智能体验。
正在智能体本领从观念走向实际的进程中,MagicGUI 大模子的开源试验供应了可行旅途的先行树模。它证实:真正的智能不是某家企业的专属品,而是全行业协同更始的产品。当本领的门槛被低落,当更始的鸿沟被突破,智能时间的盈利才干真正惠及每一个体,这大概是光荣此次开源步履的深层事理所正在,也是胀动全部 AI 行业强健成长的主要宗旨。