鸿蒙小艺一小步,人机交互一大步

操作系统有我们看不见的一面,是对计算系统底层资源的管理。但是对于大多数用户而言,操作系统看得见的另一面,则更为重要,它就是——人机交互方式。

 

如果4”年前被推上台前的鸿蒙1.0,还只是构图简单的Try it Possible”,那么如今的鸿蒙4.0,已经可以让华为终端BG CEO、智能汽车解决方案BU CEO余承东一脸从容地念出Make it Possible”。

Make It Possible(以行践言),是华为消费者业务10年前对外公布的品牌理念,其实在每一年的华为开发者大会(HDC),这个口号都会响彻全场,但是今年鸿蒙4的到来,却让这话听起来多了一丝坚定意味。

自初出茅庐,鸿蒙就开辟了一个极具特色的基调,有别于通信领域——手机操作系统的iOSAndroid,也不是计算领域——桌面操作系统的WindowsMacOS,它更是一个“横跨通信与计算两大技术领域的,面向智能全场景的分布式系统”。从我们一直以来的观察看,鸿蒙从第一代起,它定下的基调就是——

面向人与人、物与物、人与物三种交互场景并进的“新交互方式”演进之路。

 物理世界到数字世界的“桥”

操作系统有我们看不见的一面,是对计算系统底层资源的管理。但是对于大多数用户而言,操作系统看得见的另一面,则更为重要,它就是——人机交互方式。

操作系统,本质上是连接硬件与软件、人与机器的桥。而每一个操作系统的交替,都伴随着人机交互方式的革新。

“键盘”承担了这个使命最长的岁月。在古老的MS-DOSUnix时代,人们通过键盘输入命令,尽管这种方式在当时已经足够先进,但它既复杂又不直观,对普通用户来说是一道障碍。计算机的早期用户,上机之前几乎都要先进行打字软件的训练。

后来出现的WindowsMacOS,让人机交互方式从“键盘和命令行”进化到“图形用户界面和鼠标”。到了移动互联网时代,AndroidiOS通过触摸界面,又让“触屏交互”成为主流。可以说,当年智能手机出现的奇点轰动,离不开“多点触控”这一开创性的人机交互方式。

显然,从键盘鼠标到触摸屏、到语音,每一次人机交互方式的转变,都是一次操作系统使用效率的提升。

HDC2023,鸿蒙4HarmonyOS 4)强调了它的六项创新能力——分布式、原子化(元服务)、智慧(盘古大模型)、流畅(方舟引擎)、安全、个性。

其中,“分布式”不用多说,它是鸿蒙开天辟地的亮点,意味着各种设备能够在一个系统中协同工作,手机、电脑、平板、智能穿戴、微波炉、冰箱等可以一键互联、无缝切换,像是在终端之间建了一条高速公路,它们共享资源、共享信息、协同工作,形成了一个完整系统。

但鸿蒙4的六艺之中,最让我们感触最深的,其实是它最新实现的一项能力:“智慧”,鸿蒙4通过内置盘古大模型,让语音助手“小艺”脱胎换骨。

如果说我们可以将分布式定义为鸿蒙的一个支点,让物与物更好地交互。那么AI就相当于是鸿蒙的另一个支点,可以让人与物更好地交互。左手分布式,右手AI,两个支点的连线,构成了鸿蒙发展的一条主线。

华为盘古大模型的能力,则是鸿蒙新支点的底座。自然语言能力的加持,让人机交互第一次不是以人适应机器的方式进行,而是机器适应人的方式进行。

换言之,大模型出现后,自然语言成为人机交互的新媒介,计算机第一次“直接”理解了人类语言,而可以借由复杂的软硬中间件,这种“直接”,让人机交互离“自然交互”又近了一点。

不过需要强调的是,尽管我们一直在说大模型,小艺跟我们日常用的ChatGPT、文心一言等AI工具是不同的,后者是通过调用云端算力,实现了图灵测试级交流的通用工具;而小艺,则是云端和终端相互配合,把手机等移动终端的算力资源利用起来,去匹配个人用户的智慧全场景需求,成了操作系统的一个智能化身。

它是操作系统界面的一大进化,也开了人机交互的一个先河。

同样参与了这次HDC2023的和鲸科技CEO范向伟在其中一场分论坛中表示:“小艺的特殊之处在于,此前国内没有一家同类厂商,能够在消费终端,提供这样普适的用户需求。”

按照华为的官方说法,盘古大模型主要在三个方面增强了小艺的能力——智慧交互(更聪明)、高效生产力(更能干)、个性化服务(更贴心)。而拆解来看,小艺的三个能力,似乎可以给人机交互的进化带去两点思路。

思路1:它是操作系统的化身

人与人在交流过程中,通过说话、眼神、肢体动作都可以,怎么自然怎么来。同理,人机交互的方式,其实也不用只局限于单一的一种。升级后的小艺,在语音交互的原有基础上,新增了文字、图片、文档等多种交互形式,它是一种自然的交流。

第一,小艺有强大的理解能力。例如,你想要把换成天气壁纸,可是记不起来功能名字,或者不知道在哪个菜单栏里去找,这时候只需要问小艺:“怎么换一个带天气效果的壁纸?”或者直接说:“把手机壁纸设置成实时天气。”只要意思表达到了,小艺都能听懂,然后自动帮你换好。

或者,假设此时的你在某处看到一篇英文论文,但你来不及完整地看完,这就可以让小艺理解这篇英文论文,再提炼出中文摘要,甚至,你可以挑其中某个关键词问它,小艺会到论文中去找答案,精简之后再回答你。

第二,小艺有一定的创作能力。鸿蒙4的创新之处在于,小艺融合了AIGC的能力,可以做一些摘要总结、信息检索、多语种翻译、邮件拟写、内容创作等工作,带来生产效率的提升。

比如开会场景,你要向甲方发一份会邀,就可以让小艺帮你快速生成一份商务版的邮件;再比如图像场景,基于多模态的能力,用户可以直接选中手机中的图片或者一些废片,召唤出小艺,告诉它喜欢什么风格的艺术创作,让小艺进行二次创作,可以直接得到一幅艺术风格的图像。

这样的功能,虽然在ChatGPT等聊天机器人应用中很常见,但小艺的调用是基于操作系统层面的,这就比“先把会邀或图像发送到某个聊天机器人的对话框里—再写一段prompt—最后再得到答案”要方便多了。因为场景自身,已经天然构成了prompt的上下文。

第三,小艺相当于一个超级应用。传统的语音助手,仅仅停留在“用户发出一次指令,它完成一次指令”的简单操作。鸿蒙4的创新之处在于,小艺不但具有大模型的泛化能力,还可以与手机功能进行联动。

比如存档场景,你可以直接给小艺发一张图片,让小艺按照图片里的文字添加会议时间提醒,或者将图片里的联系人信息直接添加到手机通讯录中;或者用餐场景,你晚上想请人吃饭,可以直接告诉小艺“找一家在松山湖附近评分比较高的海鲜餐厅,最好有适合 4 个人的优惠套餐”,小艺可以直接调取美团服务。

小艺之所以既能听懂自然语言,又能调用手机应用,背后有两个关键因素。华为终端BG AI与智能全场景业务部总裁贾永利解释道,一方面,大语言模型具备泛化能力,能够帮助智能助手提升理解能力。另一方面,大模型Plug-in的插件能力,可以在手机内部打通各应用之间的壁垒,借助工具拓展能力。

思路2:它是个人模型的化身

小艺不仅代表了操作系统的底层功能,是终端交互的新界面,它其实也是用户的数字化身,让机器更懂我们。

华为指出,小艺将拥有一个强大的能力——记忆能力。随着长时间的陪伴,小艺会越来越懂你,它给出的小艺建议也会更贴心。

比如父母的金婚纪念日,用户可以告诉小艺帮他记住,并且提前两周时间提醒用户准备,那么“小艺建议”会在临近之时推出一张应用组合卡片,里面聚合了订餐信息、礼物导购、生日策划等信息。

比如针对经常出差的用户。假设你即将去纳米比亚出差,在订票过程中曾经与小艺交流过,那么当真正出差的时候,小艺建议会自动生成一个“纳米比亚之旅”的出行卡,里面聚合了天气预报、行程攻略、打车服务等应用,且这些都是你习惯的应用。

再比如针对喜欢跑步的用户。小艺可以根据你用自然语言发出的需求,基于自己的编程能力,自动创建出一个完整的晨跑场景:每天早上6:30帮我播报天气,6:307:00如果我戴上蓝牙耳机,就自动播放我收藏的音乐,并把手机调成静音。小艺接收指令,并且每天照做。

华为强调,所有这些相关的数据和学习,都是在端侧推理,以保障用户的安全和隐私。AI 大模型技术的发展,将会带来下一代智能终端操作系统的智慧体验。”余承东在会上强调。

当然,无论是哪种化身,作为一种新智能体,它需要持续进化的能力。这方面,小艺得益于华为技术栈的底层加持。

据悉,小艺的大模型,基于盘古L0大模型+终端消费者的场景数据和精调模型后的L1层对话模型。所谓盘古大模型(盘古Chat),是华为自研的大模型,它近期另一项辉煌成就,来自它在天气预报中的表现:今年7月初,《自然》杂志发表了华为《三维神经网络用于精准中期全球天气预报》论文。论文中显示,盘古气象大模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速1万倍以上。

《自然》评价认为:“盘古气象大模型让人们重新审视气象预报模型的未来。”显然,盘古大模型将对小艺带来持续增益。

“现在每个月至少有2亿手机用户与小艺交互。在搭载鸿蒙座舱的汽车中,87.6%的座舱操作都由小艺完成。每台智慧屏小艺平均每天被唤醒7次。”华为终端BG首席运营官何刚分享了这样一组数据。而有了大模型,小艺的未来,可能不再需要唤醒,而是常驻。

生态成,则鸿蒙成

不过,鸿蒙究竟能不能引领操作系统变革,除了技术精进之外,还需要一个必要条件,它就是生态。

鸿蒙操作系统的诞生,起源是在制裁的重压下一条拓荒之路,而华为正以自己的方式向外界证明,企业若要走出一条属于自己的路,就必须构建“根”和“魂”。“根”是生态,不可动摇;“魂”是创新,不可停歇。

在这次HDC2023临近结束,华为终端BG软件部总裁龚体表示:“如果说打造一套成熟的操作系统需要有坚实的底座、繁荣的生态、极致的体验的话,那么,鸿蒙已经完成了两大战役,还剩一个战役是生态,生态成则鸿蒙成。”

操作系统的生态,是由多个组成部分构成,包括但不限于硬件制造商、软件开发者、最终用户,以及其他相关合作伙伴。这些不同的组成部分相互协作、共同支持,也推动操作系统的成功。生态,不是企业的一亩三分地,而是趋于持续扩大、持续创新的圈。

所幸,鸿蒙生态也在路上。“截至目前,搭载鸿蒙生态设备超过7亿台,HarmonyOS注册开发者达到220万以上,API日调用达到590亿次以上,开发工具DevEco活跃用户数超过40万人。”余承东分享说道。

中国农业银行研发中心副总经理徐伟在HDC2023现场演讲时,提到了农业银行手机银行搭载鸿蒙操作系统的心得:“之所以选择鸿蒙,主要是两方面因素。一方面,我们统计了现有客户的手机类型,有超过20%的用户使用搭载鸿蒙的设备;另一方面。鸿蒙的万物智能理念符合未来趋势,潜力巨大。

根据Counterpoint数据显示,在中国智能手机市场,2021年三季度,鸿蒙系统份额仅为1%,而安卓、iOS的份额分别为86%13%。到2023年一季度,鸿蒙份额升至8%,而安卓和苹果分别是72%20%

华为消费者业务AI与智慧全场景业务部副总裁杨海松曾公开说:“对于一个生态来讲,特别是操作系统这类的底层平台,软件使用量、市场占有率是它能否活下来、能否成功的最核心的因素,16%的市占率是一个生死线。

所以,鸿蒙还需再翻番,而AI可能就是新的加速踏板。

(文章来源:科技行者techwalker