智谱 AI 张帆:企业接入 AI,要找大模型和业务的「最大公约数」
2024-1-2 16:59:48 Author: mp.weixin.qq.com(查看原文) 阅读量:6 收藏


很多企业要么对大模型抱有极高的短期期待,要么就看不到它的长期潜力。

作者 | Jesse
编辑 | 靖宇
自成立之日起,智谱 AI 一直站在国内大模型创业的最前沿,早在去年就研发了开源的双语预训练模型 GLM-130B。今年,随着 ChatGPT 爆火,又掀起了大模型应用的浪潮。从 3 月至今,智谱 AI 已经与超过 200 家企业建立了共创合作关系。
智谱 AI COO 张帆认为,这仅仅只是一个开始。这一轮大模型的浪潮,和过去任何一次 AI 风潮都完全不一样,AI 将变成社会的基础生产要素。大模型的「海平面」,正在逐渐没过人类能力的「山头」。作为企业,更要主动拥抱大模型,探索这片愈发宽广的海域。
2023 年 12 月 17 日,在极客公园创新大会 2024 的现场,张帆分享了他对企业如何利用大模型重构业务、革新产品的思考。
对企业来说,拥抱 AI 大模型,需要经历三个阶段。首先是业务信息化,从线下搬到线上;再实现数字化,把信息变成口径统一的数据中台,使其可被 AI 理解;最后则是决策智能化,借助 AI 能力,让流程自动化,并获得超出人类分析能力的 AI 洞察。
对于企业拥抱 AI 的程度,张帆也提出了一套 L1-L4 的衡量体系。从「单点使用」,到应用 AI 的基础能力,再到让 AI 成为产品的主线,最后的 L4 阶段,则是把 AI 当作一个底层要素,重构商业世界、商业模式。
企业既不该在短期对大模型有过高期待,又不应低估它的长期潜力。而是需要找到跟它的最大公约数,以此为起点,一步一步迭代,精密地把大模型能力融到企业里面。
以下为张帆在极客公园创新大会 2024 的演讲实录

01

AI 变革的「独特性」

大家好,非常高兴今天有机会能够参加极客公园的大会,来跟大家分享一下智谱在大模型上面的一些思考,以及在今天的大模型时代,我们应该如何去设计产品,以及公司。希望能够给大家带来一点启发。
首先,大家都能看到的情况是,ChatGPT 从去年年底发布以来,完成了现象级的增长,仅用两个月时间,就有了过亿的用户,且真正的加速增长在一个月内完成,速度非常快。比人类历史上所有现象级增长的应用,都要快得多。
但大模型有一个跟以往不一样的地方。以前任何一个技术,都是先有概念,然后我们期待它落地。都是概念先行,包括像元宇宙、区块链等等。
但是这一次,大模型有点不一样。绝大多数人知道大模型,不是先知道这个概念,而是先看到并且体验了产品,才知道这个技术。所以这一次是落地先行,比概念更超前。这也是为什么今年大家都感受到了大模型的风潮。
是什么原因导致了这次的技术跟以往不一样?
大模型出现以前就有 AI 了,它不是一个新概念,已经有近百年历史,而且其中有无数次,我们都认为 AI 大概可以取代人类了,人们无数次兴奋,最后又慢慢沉寂下来。为什么大模型这一次火得这么持久?
首先,移动互联网刚开始的时候,就已经有 AI 了。当时搜索、推荐引擎就已经大量使用人工智能技术。但当时使用人工智能技术的成本非常高,每一个线,都是一个独立的任务,每一个都需要明确的定义。独立的任务、独立的数据、独立的算法,以及独立的模型。
而这一套独立的系统又不会影响其他的任务,所以生产成本很高,且门槛很高。我们需要优秀的算法、专家、工程师才能做到,所以当时基本上 AI 使用还都局限在互联网公司。
到了 2013 年、2014 年,我们发现神经网络技术逐渐成熟,能够以非常低的成本去应用了,比原来降了一个数量级。在这种情况下,出现了第一次 AI 普惠,也间接导致了 AI 从互联网公司进入到产业公司,市场上出现了非常多的新型 AI 公司,来为市场提供服务。
这一次的 AI 2.0,也就是大模型时代,跟以往的几次都不一样。大模型把一切都统一了,从数据到算法,到模型、任务,它用一个模型解决一切问题。原来我们解决一个问题的时候,需要去定义、标注大量的数据来做一个模型。现在则是直接应用模型。不再需要找大量的数据训练,只需要直接给它下任务,最多给它举两个例子,它就能自己完成任务。
智谱 AI COO 张帆在极客公园创新大会 2024 上分享大模型技术带来的变化|极客公园
这带来两个结果。一方面今天大模型可以解决很多原来解决不了的问题,它的能力在增强。另一方面它的使用成本和门槛也在下降,今天 AI 的门槛可能比原来下降了两个数量级,甚至只用当年 1% 的成本就能快速做出一个非常不错的 AI 应用。在这样的背景下,AI 将会变成我们社会的基础生产要素,任何一个环节都会使用 AI,它会润物细无声地进入产品,进入商业世界,改变我们的体验。
所以 AI 不光是能给我们带来创造性的东西,带来效率提升,也能带来质量提升。就像以前创作一个东西,无论是写报告、做分析,你总是要经过一个绝望的深渊,憋半天憋不出来,等初稿出来,状态就上来了,可以快速地修改。
而今天大模型一方面可以帮我们直接跳过这个「绝望的深渊」,马上进入修改的状态,节省很多时间。另一方面,大模型的出现,也避免了过去「人的差异」。因做一件事,优秀的人、熟练的人和不熟练的人的生产效率,可能会差几倍,差距可能是从 20 分到 90 分。
但今天大模型不光可以优化 上限 90 分,还可以把下限从 20 分直接提到 60 分,无论从质量还是效率上,都带来很大提升。过去那些我们认为只有人类才能做好的事情,那些「人类占据的山头」,也在被大模型的洪水慢慢淹没。
所以我们要适应,要慢慢从山头走下来,走到海平面上。因为今天的海平面,还在持续、快速上升。

02

交互范式革新,

带来「重构」可能

到底是什么原因,让大模型带来了这样的结果?我们认为大模型的本质是底层交互的变化,是人与机器对话、人操控机器方式的变化。太阳底下没有新鲜事,人的需求一直存在,当不同的交互和能力出现时,满足需求的方式也会变化。每一次交互革新都会带来新的产品形态、新的成本、新的协作方式、商业模式以及市场格局。
在命令行时代,当时的操作系统是 DOS 或者 Linux,是代码交互的方式,学习电脑的成本非常高。所以当时我们只能用蓝色的屏幕去打字;到桌面时代,有了 Windows、 MacOS,这时就出现各种新的应用比如 IM、BBS,以及桌面游戏;到移动时代,操作系统又从 MacOS、Windows 变成了 iOS、Android,交互方式变成了触控,门槛进一步降低。原来的需求被重构,游戏从端游变成手游,人们获取信息的方式也变了,出现了抖音、微信,包括地理信息的加入,催生了各种 LBS 应用。
在移动时代之后,我们的交互还在进一步的进化,从触控,变成自然语言甚至多模态。交互的信息量和学习门槛,相比之前有了巨大的改善。因为从 DOS 时代很难学习的命令行,到鼠标、触控变得简单了,再到自然语言,无需任何学习,每个人都会说,而且它的表达力几乎是无限的。所以我们相信,在这个背景下,可能也会出现 AI 时代的新型应用,也就是所谓的 AI-native 的应用。
之前有很多人在讨论大模型能不能落地,今天我们可以非常明确地讲,智谱从今年 3 月以来,在 9 个月的时间里,见过的客户超过 2000 家,与超过 200 家进行了深度共创,在非常多的场景里都已经实现了 AI 的落地。
不只是我们,行业的一个普遍共识是,大模型可以落地。在 2021、2022 年,美国的一些企业已经做到了千万美元级别的收入。所以今天我们讨论大模型的落地,更重要的是找到大模型和业务的最大公约数
我们可以画一个坐标轴,里面是我们已经落地和正在落地过程中的一些场景。横轴上是大模型擅长的各种各样的能力,跟传统的 AI、NLP(自然语言处理)不一样的能力,纵向则是各个行业。大模型的能力和行业的属性形成了一个二维矩阵,其中每一个矩阵的点都能形成应用,其中很多都完成了落地。
今天做产品的思路也发生了变化,从最开始的时候没有 AI,更多是做一些应用,做一些业务逻辑的线上化。过去几年我们已经发现了有很多 AI-empowered(AI 赋能)的产品,把 AI 做成一个基础的功能放在产品里,并没有形成体系,但至少已经在用 AI 的能力了,像常用的人脸识别、图像识别、语音识别、翻译等等,很多大家都已经用起来了。
再到目前正在流行的 AI Copilot(AI 助手),如果你把 AI 变成一个伙伴,它能帮你重新串联业务流程,辅助你优化产品。包括微软在内,很多公司都发布了 Copilot 产品。
产品的终局,则是 AI-native 应用。AI 原生应用会重新设计、重构我们的商业、产品流程,甚至商业模式,带来全新的体验。但我们今天可能没办法直接指出什么是 AI-native,就像移动互联网刚出现时,我们也没办法预测未来会出现抖音,很难预测终局。但两者依然有共性,就是在交互革新的时代,一定会出现下一个「抖音时刻」,所以我们很期待,也相信在不远的将来就会看到这样的应用。
张帆认为 AI 的使用有 L0-L4 的不同级别|极客公园
如果我们站到企业的角度去看,企业对 AI 有怎样的需求?我们按照企业业务流程,把它分了几个简单的等级。首先是业务信息化,可以将信息收集上来;然后实现数字化,把信息化的业务系统变成可理解的、类似于数据中台一样口径统一,可以基于它来做分析、做研究;最后则是决策智能化,借助 AI 的能力,让流程更加自动化,让人能更高效地获得洞察,甚至以超越人类的分析能力来进行决策。
在这个流程里面,企业最开始可能只是在单点上,有意无意地使用 AI,这是最早期的 AI 模式。到了后面,L1 的时代,就已经开始使用 AI 来优化内部效率了。
到了 2.0,我们就开始把 AI 变成基础能力,产品里已经比较明显的展现出来。今天绝大多数企业就是在这个阶段,已经在应用 AI 强化原有的产品体系和体验。
到 L3,这时 AI 就会变成主线,会重构产品体验。它会改变我们原来的逻辑,以 AI 为核心生产要素,重新串联用户需求,带来完全不一样的体验。比如说我们今天看到的「机器问诊」、广告的自动生成。在这些场景里,AI 已经涵盖主要的业务流,甚至改变了主要业务流的工作方式。
而到了 L4 的阶段,我们会把 AI 当作底层要素来重构我们的商业世界、商业模式,带来全新的产品。
现在大多数企业还是在 L2,像微软等公司发布的 Copilot,表明 AI 开始变成主线,所以可能是在 L3。当然,我觉得国内应用 AI 去重构体验的产品,一定会越来越多。

03

企业拥抱

大模型的「正确姿势」

这里快速跟大家分享几个,已经能够落地的案例。
比如智能广告文案生成,相比很多广告公司,AI 撰写广告的效率有大幅提升,人们从原来的写广告变成了挑广告。而且 AI 可以有固定的风格和效率,在几家企业已经落地。
还有汽车智能驾驶舱。原来的驾驶舱语音交互基于规则,没有对于上下文的理解、记忆,智能化不够。所以我们提升了对话趣味性,达到了很好的效果——大家和车机聊天的频次有很大提升。
还有办公助手,来帮我们去做扩写、缩写;生活助理,你可以问它各种各样日常的问题;企业的销售,如何更体系化地整理、收集数据,赋能销售流程;企业内部的知识库,我们可以做成很小的模型,经过训练之后,这个场景能看到非常好的效果;智能签约的场景,可以用非常快的速度把项目做完,相比传统的方式,AI 给很多创业者、没有能力构建专业算法团队的人,带来新的机会,以更低的成本完成上述动作。
下面快速介绍一下大模型企业最佳实践。当然这个「最佳」加了一个引号,因为我觉得以今天的经验,我们还不敢说最佳。
首先,在开始的时候企业要先扪心自问,自己是否「大模型 ready」了。很多企业要么就是对大模型抱有极高的期待,要么就是认为它现在还没法做到。我们抽象出一个体系,认为企业要先拷问自己几个问题。
公司数字化程度够不够?如果没有信息、没有数据,就没办法做 AI 应用;我们是否能明确找到一个落地试点?且这个试点的场景符合大模型的能力;我们是否能有一个明确的可评测、可衡量的目标、指标;是否能安排一个全职的负责人来负责这件事,以及我们是不是有一个合理的期待?我经常跟大家说,既不应该在短期对大模型有过高期待,又不能过分低估它的长期潜力。所以我觉得大模型非常有潜力,但我们在今天,企业需要找到跟它的最大公约数,以此为起点,一步一步迭代,把大模型能力精密地融到企业里面。
我们再看看大模型应该怎样定制?其实大模型比我们以往用到的业务系统更简单,它的定制性和复杂程度没有那么高。大模型真正能获取知识的只有三个维度:预训练,相当于通用的能力;微调,相当于垂直领域的能力;prompt,相当于任务能力。所以我们要知道大模型是怎么学习知识、利用知识,把合适的信息放在合适的位置,才能有好的效果。并不是大力出奇迹,把所有的知识、数据一股脑地丢进去,那样模型会坏掉。
今天的企业如何构建自己的大模型战略?我觉得要考虑四个方面。
  1. 你需要选择一个靠谱的、能持续存在的基座模型,作为你的合作伙伴;

  2. 在此之上构建适合这个时代新的组织,包括 prompt 工程师、微调工程师,甚至还要有一个大模型的 BP,来帮助你把大模型能力传导到各个业务模块。

  3. 然后开始建立正向的飞轮,来沉淀数据资产,通过数据让模型能力越来越强。

  4. 把能力融合到业务场景里面,带来新时代的竞争力。

我的分享就这么多,谢谢各位。
*头图来源:极客公园
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你认为小红书的
商业价值是什么?
 

热点视频

小米汽车首次发布!在今日举行的小米汽车技术发布会上,雷军表示:我们的汽车还需要几个月的验证测试,由于大家高度关心,我们先提前发布一部分。
点赞关注极客公园视频号
观看更多精彩视频
 

更多阅读


文章来源: https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653030008&idx=2&sn=ba7b0ad5ffbe73e2378f663848ad0f96&chksm=7e577bce4920f2d8353039ad8eb1ae5447bc613707091d5d4cd41a0bb54fb86e9447a5432d85&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh