手机 AI 2.0 时代，OriginOS 5 找到了哪些「成功密码」？

手机 AI 2.0 时代，OriginOS 5 找到了哪些「成功密码」？
2024-10-11 02:1:0 Author: mp.weixin.qq.com(查看原文) 阅读量:1 收藏

提供最丰富功能的同时，减少用户负担，保持高效，是未来智能手机系统「好用」的关键。

作者 | Jesse
编辑 | 靖宇

手机 AI 浪潮的 2.0 时代来了。

自去年安卓厂商纷纷接入大模型，推出第一批主打AI 功能的手机之后，手机与 AI 的融合进程就切换到了快车道。上个月，苹果甚至在 AI 功能还未正式推出时，就将它作为 iPhone 16 的主打功能进行宣传，足见竞争形势的激烈。而现在，安卓阵营这边的第二代手机 AI 产品也纷纷蓄势待发。

必须承认，要将 AI 大模型能力融入手机，厂商所面临的问题依然严峻。这里并不完全是模型性能的问题，而更在于产品设计。当下「AI + 手机」产品的自动化、便捷化的程度不足，相关功能渗透率依然不高，远没有「出圈」。

想要打造真正好用的「手机 AI 」，不只是要做出好的 AI 功能，而是要从系统层出发，对系统内整体的交互逻辑进行重构，使它变得更智能。

2024 vivo 开发者大会上，vivo 推出焕新升级的 OriginOS 5。这代新系统不只是 AI 功能更强大、更智慧，系统全局的各项能力也都再次迭代。vivo 的目标，是让 OriginOS 成为 AI 时代最好用的手机系统。

以「便捷」为核心的设计

过去一年，大部分手机厂商做AI 功能的思路，都是先围绕「聊天」式的交互展开。

以「聊天」为起点很合理，因为「智能语音助手」已经是手机上存在了十年以上的功能，AI 大模型的应用落地也是从 ChatGPT 等「聊天机器人」开始的。

问题也正出在这里。对普通用户来说，要完整地组织语言发出一条指令，编写一条prompt，是一个成本很高的行为。智能手机相比 ChatGPT 这种没有任何数据基础的 AI 应用，最大的优势在于，很多数据其实已经在手机上了，不应该再让用户手动输入。

但在这个过程中，也有两个问题要解决。一是要将 App 内各种各样的数据转化为 AI 能够理解的格式，其次则是在授权的层面要做出清晰界定，防止隐私泄漏和数据污染的问题。

这就是 OriginOS 5 最核心的 AI 功能升级，Jovi 语音助手与「蓝心小 V」深度融合，蓝心小 V 不再是一个单纯的语音助手，而是拥有了更全面的功能。用户现在可以长按导航条唤醒蓝心小 V，唤醒之后，不只是可以语音、文字输入指令，而是可以直接框选当前屏幕上的内容，输入给蓝心小 V，进行搜索等后续处理。

这一设计非常巧妙，因为大部分时候我们想要搜索、处理，就是我们眼前正在看到的内容，通过「圈搜」的方式，最大程度降低了输入的负担，也避免了 App 适配和兼容的问题，可以覆盖手机内一切场景，还保证了隐私的边界。

小 V 圈搜的用法覆盖了各种场景。比如看到一篇小红书笔记，可以圈搜图片上人物的相关资料、相关商品；圈出一段聊天记录、机票火车票订单来创建日程；截取一段电子书、文章、工作材料进行翻译、生成一篇备忘笔记……

更重要的是，用户在框选内容之后，依然可以主动输入指令，进行各种不同的处理，而如果这个「视觉识别」的逻辑拓宽到摄像头，用户可以拍摄现实中的任何内容输入给 AI，进一步将蓝心小 V 的可能性拓宽到无限大。这个功能在目前已在 OriginOS 5 里落地，是以「vivo 看见」的形式存在，主要聚焦于视障人群，帮助他们理解周围的环境。借助 AI 大模型的理解、检索、生成能力，这个功能的外沿还有被进一步拓宽的空间。

基于同样的「读屏」逻辑，vivo 还对输入法进行了优化，推出了小 V 写作功能。在各种聊天界面、电商评价、朋友圈发布界面，都可以基于当前手机屏上显示的内容，自动生成内容，辅助用户进行文字编写。

这一切都并不是模型层面的革命，而是单纯的产品创新。但它带来的体验优化显而易见。想通过 AI 助手 App 实现类似的「智能回复聊天」功能，用户需要在聊天界面截图、裁切，在 AI App 里编写 prompt，得到回应，再将回应的内容复制到聊天框，而现在则只需要点击按钮就可以实现。

除了读屏之外，OriginOS 5 还加强了各种场景下，多模态数据的「自动处理转换」能力。新的小 V 电话助手、小 V 帮记可以将电话、线上会议的音频实时转成文字，显示字幕，并进一步实现「智能生成摘要」、「同声传译」等功能。这个功能的用法已经很成熟，我们今天大部分电话会议都会有录音，以及转写的文字版。但在手机系统内植入这一功能的最大优势在于，它可以将不同协作平台、不同场景下的电话、会议记录集合到一起，更易于管理。

大模型AI 是一个覆盖面极为广泛，但也因此很抽象的技术，难以进行具体的功能定义。大部分厂商，都把这个问题化作一个开放的输入框，丢给用户去思考。最终导致了 AI 产品的逻辑并不复杂，就是一个聊天界面，但用户实际依然不知道它有什么用，要怎么用。

可以说，OriginOS 5 开启了一次「便捷化」革命，将手机上的数据，送到离 AI 大模型接口更近的地方，方便用户更容易触达。这是 AI 2.0 时代最重要的主题。

帮AI建立「长期记忆」

除便捷化之外，当下所有大模型AI 产品，面临的另一大难题是「记忆」：几乎所有大模型产品，都无法对用户进行深入了解。在和用户对话的过程中，之前内容的权重会被迅速稀释。也就是说，AI 特别「健忘」，很多时候用户要重复输入同一指令，来保证 AI 还记得之前的要求。

对手机来说，问题也是类似的。我们进入移动互联网时代已经超过十年了，很多人手机上、云端储存的，是十年跨度的数据，这些数据淤积在手机里，检索起来变得非常困难。

这里最典型的场景是相册。很多人相册里都储存了上万张照片，要从中迅速找到一张特定的老照片，变得非常困难。所以过去几年每个手机厂商都在做相册的自然语言检索，依据位置、人物等等标签进行分类……

但在相册之外，如何让手机真正成为我们的「人生数据库、回忆录」，依然是一个更大的问题，而这又恰好是大模型 AI 能够发挥作用的一个场景。

vivo在 OriginOS 5 的相册里加入了「时光剪影」功能，不只是帮用户迅速找到想要的照片，而是对照片进行二次组织、加工。它可以自动筛选出一段时间里的照片，通过大模型理解这段回忆，进行智能剪辑、配文、配乐，其中还新增了支持生成 AI 人声音乐的功能。

这是全行业的大趋势。过去我们在计算机上处理的数据都是「文件」，是以「数据库」的逻辑进行组织的。但在智能手机时代，这些数据是我们自己拍的照片、写的笔记、与他人聊天的记录，是非常具体的经历和回忆，完全可以用一种更贴合人脑思维的方式，以富文本、视频的形式，进行多模态的组织。

在 OriginOS 5上，最能体现这一思路的功能是「小 V 记忆」。功能上，目前小 V 记忆很像一个「日记本」，能够把不同模态的数据整合在一起，以类似手帐的方式呈现出来，其中包括图片、视频、文本、网页……

而在「小 V 记忆」的「图谱」功能里，它把用户本机的文件数据全部进行了标签化处理，按照语言逻辑，生成了一张图谱，借此将不同的文件串联在一起。而这些数据，明显有成为 AI 知识库的潜力。就是说，未来用户可能可以利用 AI 助手，来快速挖掘自己手机上的所有文件信息，以及信息之间的关系。

而更重要的是，AI 也可以借助这一套私人知识库，建立起对用户的深入、长期理解，来满足个性化的需求。也就是说，未来我们在和 AI 交互的时候，很多具体的需求，不需要在指令里详细说明，AI 就能「心领神会」。

在实现输入的便利化，建立起长期记忆和私密知识库之后，手机与 AI 结合的未来，还有巨大的想象空间等待着探索。

这次vivo 放出的新功能中的「订座助手」，就能让我们稍微一睹这样的未来。它基于大模型的理解和生成能力，在用户输入用餐需求后，会自动查找餐厅、获取商家联系方式，拨打过去并代替用户与商家进行订座沟通，最后返回结果，临近预约时间，用户会收到提醒，之后可以一键导航到餐厅。

听起来可能有点太超前，甚至像科幻小说的情节。但它的确展示出，当 AI 充分利用了手机的各项功能之后，能便捷地实现多么复杂的任务。

智能手机系统的

下一步是做「减法」

尽管AI 是 OriginOS 5 最重要的迭代更新方向，但我们应当意识到，AI 只是手段，它背后隐含的更重要的时代背景，是智能手机的「减法革命」。

过去十年，智能手机迭代的大方向是做「加法」。屏幕越来越大，储存越来越高，伴随着通信技术和带宽的提升，可以说，智能手机终结了信息匮乏。

但现在，越来越多用户面临的问题是信息过载。我们生活中的设备越来越多，App 越来越多，为抢夺用户注意力的过度设计也越来越多。买一张机票有 4 个 App 推送通知，很多内容看完就忘了在哪看过，各种菜单的层级、选项，多到眼花缭乱。即便用了这么多年的智能手机，也常常找不到自己想要的功能在哪。

所以，智能手机下一步的发展方向，特别是软件层面的迭代，就是要解决这个问题。

OriginOS 5上，另一个很重要的功能更新是「原子岛」。表面上，它的产品逻辑和 iPhone 的「灵动岛」非常相似，后者是为了适应 iPhone 硬件变化推出的功能。但「原子岛」不太一样，它不只是利用屏幕的一块区域显示点什么，更重要的是，它还具备「预测、建议、信息流转」的能力。

比如，「原子岛」会基于日程事件、用户习惯，主动提供 AI 服务建议。比如用户复制了一行地址，拖到「原子岛」区域，就能快速跳转到地图；复制图片，就会优先出现「发送到微信」等分享选项。复制航班代码，原子岛就会自动弹出查询航班信息的按钮。

过去，智能手机的功能都被封装在 App 里，不同 App 之间缺乏协调机制，导致了信息的重复问题。而「原子岛」、「小 V 建议」的出现，就是要利用更少的 UI 元素，实现更多的功能服务。过程中通过 AI 能力来预判用户的需求，从庞杂的信息中浓缩、总结出重要的部分，帮助用户「消化信息」。这也是 AI 大模型与手机结合的重要意义。

智能手机系统上一次类似的革命，是UI 设计从拟物走向扁平化，凸显出信息，降低用户的视觉负担。这一点上 OriginOS 5 依然在持续优化，统一了很多视觉动效，增强了界面之间的空间关系效果，并强调「数字化设计」，增强关键信息的呈现。

最后，OriginOS 5 也对最基础的流畅性、续航、网络信号等性能进行了升级优化。通过「Ledger 储存账本」对内存进行底层统一调度，减少了 App 长时间前台使用时，过度占用内存的问题，减轻了 App 负载带来的卡顿。还对动画流畅度、能效续航、抗老化能力分别进行了针对性优化。

实际上，无论是基础的流畅性能优化，界面交互上的创新，还是最前沿的大模型AI功能，它们最终都指向了同一个目标，即如何在提供最丰富功能的同时，最大程度减少用户的负担，保持操作系统的高效。这是未来智能手机操作系统「好用」的关键。OriginOS 5 通过一系列的便捷化设计，AI 功能创新，性能优化，已经成为 AI 时代最好用的国产手机 OS 之一。

找到正确的方向路径，通过与 AI 能力更深入地结合，OriginOS 的未来也因此变得更值得期待。

*头图来源：vivo

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

极客一问

你对 OriginOS 有哪些期待？

热点视频

马斯克：警惕信息茧房，别让社交媒体操纵了你。

点赞关注极客公园视频号，

观看更多精彩视频

更多阅读

文章来源: https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653057277&idx=2&sn=12abebf81d971ea2df25db7ab0cdfb58&chksm=7e570d4b4920845dd0b907dc8a481d15e567b7c9e57d60a6768001c7648c13f8ec9cb6205ed5&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh