荣耀MagicOS、YOYO智能体和“忒修斯之船”
无疑,我们正处于一个AI重写一切的时代,重写的对象,自然也包括有“智能”两个字作为前缀的“智能手机”。显然,智能手机操作系统AI化(或者说AI OS),在其中的重要性就几乎无需多言。
首先,从技术层面讲,手机OS是AI在端侧设备落地的首要承载,正好是“ChatGPT”这种云侧AI的相对面。
其次,从应用层面讲,手机上的AI,也是每一个消费者在使用距离上最近(就在手中),和使用时间最长的AI(时刻不离)。而提供交互界面和软硬件资源管理的,是操作系统。因此,AI化的OS本身,其实也可以看作是消费者所使用的第一款“基础AI应用”。
说到AI,大家总会谈到一个时间节点“ChatGPT时刻”。而近日荣耀召开发布会,“发布行业首个搭载智能体的个人化全场景AI操作系统——MagicOS 9.0,推出全新自研魔法大模型家族,宣布YOYO助理正式升级为YOYO智能体”,这个AI三连招,自然是一个非常值得关注的标志性事件。
不过,我并不想把这些重要事件讲得似乎是横空出世。似乎AI世界的一切,都是在某一天开始了新的剧情。因为,重要的东西,往往不是一蹴而就的。相反,它可能是时间沉淀的结果。
今年1月份,荣耀CEO赵明获选中国经济新闻人物(2023-2024),他在获选感言中说,“(荣耀)不是一个盆栽,从一个地方挪到另外一个地方,应该是一棵大树,砍掉了相对粗壮的枝丫插在土里,这时候的荣耀需要重新构建自己的体系,要重新把根扎在土里。”
在一次荣耀技术沟通会上,我也在一份资料中看到荣耀自己说,在AI整个大时代,它们是用AI在重构整个操作系统,呈现的正是一个种树的过程。所以,我想用“种树”的逻辑,来谈一谈对这次MagicOS 9.0发布的体会。
第一重理解
从技术角度说,要让AI OS成为一棵参天大树,需要坚实的技术根基。而这个扎根的过程,自然不是短时间内可以完成的。
两年前MagicOS 7.0的时候,荣耀提到了在发展与AI关系密切的根技术,包括Magic Live智慧引擎、MagicRing信任环,和以“懂你”为设计目的的YOYO建议等。这些根技术,都和今天的MagicOS 9.0,有直接性的关联。
这次MagicOS 9.0更新,荣耀又在这个技术根基上,做了很多功课,比如打造大模型驱动的AI内核……而这一根基,与智能体驱动的AI交互,和面向未来的开放服务构建的AI生态息息相关。
具体来说,MagicOS 9.0打造了全新的魔法大模型家族,这样的大模型家族涵盖大语言模型、图像大模型、语音大模型、多模态大模型,参数规模横跨500万-30亿。
值得一提的是,和上一代MagicOS 8.0推出的70亿参数规模的魔法大模型相比,MagicOS 9.0上的30亿参数规模的大模型加载速度提升了77%、出词速度提升了500%、功耗降低了80%,ROM和RAM的占用也得到大幅下降。
这正是荣耀在AI内核上做的一系列工作使然。
第二重理解
从生态的角度,种树意味着“有所为,有所不为”。
荣耀这几年一直在谈平台级AI,并将端侧AI分为四层架构。
第一层是AI使能跨设备和跨系统的融合,第二层是用AI来重构操作系统,第三层、第四层是AI的应用层,以及AI的端云协同。
这四层架构,后来也逐渐成为很多手机厂商,甚至包括苹果在内的公司跟进的端侧AI技术逻辑。
不过,这四个层次中,荣耀投入的力度并不同,它将第一层、第二层作为自己的重点。因为这才是更接近手机底层使用的技术。而AI应用等三四层,更多和智能手机能安装、承载哪些AI类型的APP有关。
总结来说,手机上有哪些AI应用可以用,是第三、四层的工作,但是手机自身会有多智能,是第一、二层的事,也是一个手机厂商的基本使命所在。
而荣耀在AI OS中的第一层和底层工作,如果要用一个词来定义,我觉得是荣耀一直在讲的是:“懂你”。
所谓“懂你”,是指荣耀所打造的是一个非常个人化的OS,能够在消费者使用手机的过程中,构建多维度的个人学习能力,在端侧构建个人知识库。
这些懂你的创新,已经帮助消费者创造了很多便利。
早在MagicOS 7.0上,荣耀就实现了跨设备和跨系统的AI,提出了用AI重做操作系统,真正让手机系统实现了可进化。
在随后的MagicOS 8.0上,荣耀又将大模型能力引入到操作系统中,不仅强化了操作系统的各项能力,还将意图识别能力带到了操作系统中,这让荣耀任意门、YOYO建议、灵动胶囊这些独特应用的准确性,乃至用户体验远远超越了同期的操作系统。
这次,荣耀MagicOS 9.0又在这个懂你的基础上,向前迈了一大步,就是“帮你”,也就是通过“智能体”——Agent的方式,不但能理解用户的需求意图“懂你”,还可以直接帮助用户,通过“自动驾驶”的方式,将这个意图具体实现。
所谓“自动驾驶”,是指YOYO智能体在听到用户的语音或收到文本指令之后,不需要用户自己进行一些繁琐的操作,就可以自动由YOYO智能体帮用户调用后端APP、服务或功能,横向关联不同应用,纵向到APP菜单深处操作,帮助用户实现一系列功能。
用一个点咖啡的例子来说明会比较形象。
很多用户日常在使用手机APP下单点咖啡时,需要先进入APP或小程序,再找你想要的咖啡类型,之后还需要选择口味、是否加糖等,最后才到支付页面,这套流程下来,往往也需要不少耐心。
现在,荣耀手机的“自动驾驶”YOYO智能体,只需要一个命令,甚至像“帮我点点儿喝的吧,我有点困了”这样模糊的指令,就可以帮助用户点一杯你想要的咖啡。
要注意的是,在这个过程当中,其实智能体并无现成的API可以调用。实际上,它需要学习用户屏幕上的内容,自己形成上下文,拆解、编排任务,从而模拟消费者进行相应的操作。
这其中的AI工作流极为复杂,需要模型意图理解、复杂任务规划、任务自动执行几个关键部分,才能最终实现智能体驱动纯AI视觉的三方零适配自主执行。
荣耀产品线总裁方飞在接受采访时告诉《科技行者》,“大家看到的通用大模型也具备任务拆解能力,但通常端到端只能做到60%~70%的准确率,要真正应用到终端产品中,我们往往需要的是95%以上的准确率,这就需要我们深入去做模型微调、数据优化等工作,这也是体现我们核心价值的地方,另外,我们还需要考虑效率的问题,需要我们在性能和模型规模上做很好的平衡。”
正是在这一系列技术上的深耕,让荣耀的MagicOS 9.0实现了L3级的“自动驾驶”,值得一提的是,这一“自动驾驶”能力也经过了信通院的权威认证,被认证为迄今最高的终端智能化等级。
不过,其实我更想强调的,也是文章开篇我提到的,是我对“种树”的第三重理解。
也就是说,荣耀的MagicOS的AI锻造之旅中,虽然有今天MagicOS 9.0这样一个重要发布节点,但却并不存在一个完全特殊的“重要时刻”。
相反,一切都是日积月累,坚持长期主义的过程,正如一棵参天大树的成长非一日之功。
如果大家查阅历史资料,就会发现早在2016年,荣耀Magic系列手机初代发布的时候,智能一词就已经融入其中。
在当时的一个官方报道中,有这样一句话我摘录给大家,“相较于EMUI,Magic Live系统的界面采用了全新的设计风格。更重要的是,Magic Live提供了更智慧的交互、服务以及信息呈现的体验。”相信大家会认同,这句话即使放在当下,也并不过时。
荣耀的长期主义,让我想到了一个古希腊神话中的一个哲学名词——“忒修斯之船”。
“忒修斯之船”说得是,如果一艘船,在航行的过程中,每一块木板都被逐一替换后,当它到达彼岸的时候,所有模板都被替换完毕,它还是原来的那艘船吗?
这个问题探讨的其实是,在事物的发展变化过程中,它是否还能保持其核心身份与目的。
在我看来,荣耀手机的AI OS一系列迭代,就是一个忒修斯之船的“现实重演”。
从2016的初代Magic引入智慧引擎,到与ChatGPT同岁的MagicOS 7.0,和年初具备“任意门”功能的版本8.0,再到今天的MagicOS 9.0,随着操作系统的不断升级,荣耀手机正在全方位智能化,而组成这部手机的各个部分,如所支持的硬件、算法等,都在不断地被优化和更新,这就像忒修斯之船中的木板一样被逐一替换。
在这个过程中,船上的乘客,也就是手机消费者,其实并不会意识到在哪个瞬间,可以作为荣耀AI的“ChatGPT时刻”。
但是大家会逐渐发现,手中的手机已经并非原来的物种,而是在不知不觉中自下而上完成了迭代更新,成了越来越懂你和逐渐可以帮你的AI硬件。
我们可以用亚里士多德的“形式因”“质料因”“动力因”“目的因”的四因理论,来做更进一步的诠释。
“形式因”“质料因”是一个事物的材料组成和表现形式,而动力因、目的因,则是这些“组成表现”的内在驱动和使命目标。
对于MagicOS,以及操作系统之上的荣耀智能手机而言,软硬件、算法、模型都属于这艘“消费电子忒修斯”的“质料因”“形式因”部分。
而“质料因”“形式因”的迭代,是没有“ChatGPT”时刻的,因为每一刻都很重要。
我们更需要强调的是,对于消费者来说,这些“组件”更新哪怕外在面貌变化再大,比如从当年的直板机,到后来的折叠机,也不会感受任何的“违和感”,而是一脉相承。
这是因为,荣耀AI的“动力因”和“目的因”一直都没有变化,一直是“越来越好用”“越好越懂你”。
懂你,也在第九个版本这一代,从“懂你”升级为进一步的“帮你”。
所以,虽然组件变了,但“忒修斯”还是“忒修斯”,“Magic”还是“Magic”。
从“懂你”升级到“帮你”, Magic真正在变的,是越来越聪明。
对于荣耀手机的消费者来说,对荣耀智能体愈加聪明只会愈加开心。
因为点一杯日常要喝的咖啡,和查询付费订阅,并不是一个正常消费者所愿意亲手做的事情。
相反,这些工作,都是一些消费者会做,但是不想做,或者是想做,但是不了解如何做的事情。
如果让我用一个正常生活中的例子来做比喻,大概就是刷碗了。
现在,通过看到智能体,智能手机已经能够“自动驾驶”的帮消费者搞定这些麻烦事儿,中国的手机用户因此提前看到了未来手机操作系统的样子。
大概,这也是AI最美好的样子。
(文章来源:科技行者techwalker.com)