有些公司开始要做智能车的「大脑」了 作者 | 曹思颀 编辑 | 靖宇「一家成功的智能电动汽车公司,一定是一家成功的 AI 公司。」这是汽车领域近两年最时髦的一种表达,最近一次出自蔚来 CEO 李斌之口。李斌如今常常把企业家、投资人等一系列头衔藏起来,以自媒体人自居,核心目的是要让更多人了解一个真实的蔚来,不能因为过往被打上了「服务好」的标签,就认为蔚来技术不好。他说:「创新才是蔚来的底色。」有过类似的表达的不只有蔚来一家。过往每家汽车公司都会有自己的标签,例如操控感、豪华感、动力感、经济性……但现在,大家有了一个新的共识:给自己贴上 AI 的标签。李斌和秦力洪分享蔚来在科技创新领域的最新思考 | 图片来源:极客公园让汽车变得更聪明,是第一个关键问题,也是车企们现阶段需要尽快向用户展示的重要能力。但「变聪明」这三个字,本身又是一个很难量化的描述。怎样才是一个聪明的机器呢?OpenAI 的首席技术官 Mira Murati 曾经试过在一档播客节目中,用人类的智力水平类比过 AI 模型的能力:GPT-4 相当于聪明的高中生,而 GPT-5 有望达到博士的水平。这种说法虽然通俗易懂,但其实很难直接套用在汽车上。因为比起大模型本身,智能汽车作为一个巨大的智能硬件载体,不仅要有「智力」理解问题,还要通过具体的「能力」解决问题。如果把智能汽车比作机器人,那么这个「人」变聪明的过程中,需要一个「聪明的大脑」——不仅要拥有模型本身的智力;还要负责为「身体」制定一套合理的任务管理和分配体系,以确定不同「器官」需要在不同时候按怎样的优先级处理一系列不同的任务。举个例子:主动悬架是这两年很火的新功能,其核心就是根据记忆和计算,让车辆在行驶过程中对悬架参数进行调节,以应对不同路面的颠簸程度,带来更好的驾乘体验。这涉及到了底盘、智驾等不同领域之间的配合。如果没有一个统一的大脑协调,由于带宽、延时等技术问题,配合就容易不协调,达不到想要的体验。7 月 27 日,在 2024 NIO IN 蔚来创新科技日上,蔚来发布了「整车大脑」——整车全域操作系统 SkyOS。这代表着蔚来对于 AI 时代的思考:据介绍,基于这一系统,可以在跨域任务执行、算力分配等方面提供更好的体验。而这些努力都是为了同一个目标:让智能汽车变得更聪明。
01
世界模型,
让智驾「会推理」
智能驾驶是 AI 上车关注度最高的场景,也是近年来技术路线变化最快速的一个领域。过去几年,智驾经历过几次技术路线的迭代,既有从高精地图方案切换到无图模式,也有以特斯拉为代表的部分公司尝试纯视觉(去激光雷达)路线。但这些路线的切换,本质上只是为了降本,并没有改变智驾「规则驱动」的本质。这个系统依然需要大量的程序员花心思写代码,改 BUG。换言之,这只是人类通过编程语言,把自己对于驾驶的认知翻译给机器的一个过程,智驾系统本身并没有产生智能。端到端技术的出现,改变了这一套规则。规则驱动正在向数据驱动演进,人类试图复制在大语言模型领域里已被验证成功的 Scalling Law,通过投喂大量视频数据,把智驾系统训练成一个可以涌现出智能的神经网络大模型。这种模式的最理想结果,是马斯克曾经描述过的人类驾驶思考模式,即:输入视频(看到的路面信息),输出控制(踏板及方向控制)。端到端的智能驾驶架构图 | 图片来源:蔚来套用「AI 三大基石」的理论,要达到这一目标,需要解决算力、算法、数据三大关键问题。蔚来在数据上采取了「群体智能」的方式,即:基于大量预装高算力、高配感知硬件的量产车获得大量真实数据。据介绍,算力则更是一个外部问题,并不由车企自身决定。所以,下一阶段的重点,是从算法本身出发,提高模型自身的训练效率和推理能力。蔚来给出的下一个答案是:世界模型(Nio World Model,以下简称 NWM)。你可以把 NWM 看成是 Sora 的一种变体,某种程度上也是一个视频生成的产品。略有不同的是,Sora 主要依然基于「文生视频」,而蔚来的世界模型则是一种「视频生视频」:根据官方介绍,NWM 可以将 3 秒钟的真实驾驶视频作为提示词,生成最多长达 120 秒的视频。蔚来将 NWM 的职责描述为「推演万千平行世界」| 图片来源:蔚来但视频生成显然不是蔚来的目的,蔚来也不是要用 NWM 生成的视频来做训练数据。仍然用人类的思维模式做比喻:在一个人类司机选择超车前,TA 会根据实时路况判断左右不同的变道路线以及选择不同的超车时机。这一决策和推理的过程,NWM 通过一段生成的视频,具象地表达了出来。根据官方介绍,NWM 能在 100 毫秒内推演出 216 种可能发生的场景,并找到最优解。所以,NWM 的出现,实际是通过生成式 AI 这条技术路线,找到了智驾系统在新工作方式(端到端)下变得更聪明的新路径。
02
发掘座舱里的「人味」
AI 在汽车上的另一个深度应用场景,就是智能座舱。如果你曾经分别体验过一台「传统车」和一台「优秀的智能汽车」,你应该不会认为智能座舱里的种种功能只是花拳绣腿。笔者一直认为,在驾驶过程中,最安全的人车交互方式应该是通过语音——它可以保证你的视线和双手继续保持在对驾驶的关注当中。可以说,在座舱智能化这件事上,具有互联网基因的造车新势力们显然已经走在了很多传统车企前面。现在,当 AI 浪潮到来的时候,它们已经开始面对下一个选择,就像前阿里董事会主席张勇说的那样:用 AI 的方法,把所有产品都重新做一次。蔚来希望用 AI 重新定义人车交互的范式 | 图片来源:蔚来就目前来说,蔚来基本把目前市面上主流的 AI 软硬件玩法,都搬到了车上。例如 AI+音乐,通过 AI 加持的音质算法加成,为缺乏全景声的音源进行优化,再用车机自带的硬件进行播放。停车守卫功能在 AI 加持下,则变成了一个类似视频会议纪要的产品。AI 会筛选生成值得关注的重点瞬间,如果不幸在停车时遭遇剐蹭等,这个产品就可以变成一个提效工具。还有即将上车的旅行回忆功能。发布会现场显示了一段自驾游之后,根据车载摄像头捕捉的沿途风景自动剪辑生成的 vlog,其中还有一些标志性山峰进行了地点标注。类似的 AI 剪辑功能,过往在运动相机等场景有过应用,如今蔚来也把它搬上了车里。除此之外,蔚来此次还展示了 NOMI 在多模态能力加持下的进化:可以看到「嘘」的手势,自动调低音量;也可以基于不同环境下,表达恰如其分的情感关心。蔚来用「情感智能」描述了 AI 在座舱领域的进化。但在笔者看来,这些单一功能在 AI 本身的能力上并没有非常巨大的突破,反而是想到这些实际应用场景,并且落地上车的决策值得关注。在座舱领域里,也许目前应用场景的挖掘是先于模型能力进化的。7 月 27 日晚上,结束了媒体采访的李斌几乎是马不停蹄地进入了又一场线上直播。和过往无数次在网上发声一样,他又遇到了一些或尴尬或尖锐的问题,他选择直接念了出来:「别天天整抖音了,用心管理公司吧。」李斌笑着解释这只是他第 5 次直播。但就像那些被藏进智能座舱里,也许现在使用率还不高的小巧思一样,他觉得蔚来在创新上的思考和努力是需要介绍给大家的,「不然大家每天都说蔚来服务好,就好像我们技术不好一样。」索性,这样的表达收到了很多正面的反馈。李斌在媒体沟通会上自嘲道,以前大家说因为一个人(指李斌自己)不买一台车,现在也有很多人说要为了一个人买一台车,他很高兴自己能做到这一点。一旁的秦力洪补充了一句:以前大家最期待的是年底的 NIO DAY(蔚来日,蔚来车主最大的活动),我们希望以后蔚来 NIO IN 可以成为媒体和车主最喜欢的活动。期待这一天可以尽早到来。*头图来源:蔚来汽车本文为极客公园原创文章,转载请联系极客君微信 geekparkGO极客一问你对智能驾驶有哪些期待?