25年奇幻漂流,一群人正把中国制造业的数据带回故乡
2023-7-10 11:4:52
Author: 浅黑科技(查看原文)
阅读量:8
收藏
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
说起1997年,很多人心里都会浮现出一些照片,它们有些许褪色,却鲜活柔软。那一年,有些小事,戴安娜王妃逝世,深蓝战胜卡斯帕罗夫,人们涌进电影院看了《泰坦尼克号》。那一年,也有些大事,香港回归,三峡截流,中国“入世”进入了谈判攻坚——一个经历风霜重新振作的大国,决定敞开劳动力和市场,用发展中国家的谦卑,拥抱来自全世界的产业。那一年,张金银还不叫“行在”,而是刚走出大学校门的“小张”。小张进入一家外企,成为了人人羡慕的“别人家的孩子”,也成为了那个时代的一场绝佳隐喻。为了利用中国便宜的生产力和广阔的市场,这家外企一口气建了20多座工厂。而小张的岗位很有意思,表面上叫“IT系统开发工程师”,但本质上他是个“铸剑师”。1、工厂从原料采购,到仓储,到生产,到库存,到销售,到财务,到员工管理,整个流程极其繁琐,每一步都需要专门的系统。但仔细一瞧,各个系统里都含有同一种东西——数据。2、数据就像铁矿。它们躺在各个系统里,现实世界里工厂从进货到生产到销售的流程走完一遍,公司账上的钱就多一些,这些铁矿也会增加一些。散落的铁矿没啥大用,但如果把这些铁矿收集起来,再冶炼锻造成一把剑(数据报表),那用处就大了!!3、企业老板手握这把“重剑”,在办公室里抽着雪茄喝着威士忌就能发现经营中的蛛丝马迹,然后“长袖舞剑”——优化人员、调整工资、调整进货、库存、生产节奏,然后赚更多的钱!话说仅仅过了几年,大家就不好意思再叫他小张,因为他从“铸剑师”变成了“铸剑大师”:为了管理好这些“矿”,大师升级了美国的 Oracle 数据库,让数据像温顺的羔羊各安其位,不错不漏;为了把“剑”铸造得更锋利,大师还引入了德国的 SAP 数据仓库,让数据之间能联合计算,老板关心啥指标,它就能算啥指标。
这些数据应用组合起来,就像十八般兵刃,把竞争对手打得满地找牙。最牛的时候,全国20多个工厂,几十个数据库,都在小张手下——无论出啥问题他都能修。有一次数据库出故障,机房里所有领导在他后面站成一排,眼巴巴地看着这位“大神”,公司的身家性命妥妥地都系在他一个人身上。。。对于一个刚毕业几年的技术人来说,那绝对是巅峰体验呀!但对一个国家的来说,这。。。何尝不是个有点尴尬的瞬间?虽然整个生产销售过程都发生在中国境内,但生产线是国外进口的,经营过程产生的数据是外企的,存放数据的数据库是外国的,计算数据的数仓也是外国的,赚来的利润是外企的。小张吭哧瘪肚铸了半天剑,最后跟中国人好像没啥关系。跟中国人有关的,满打满算就两件事:第一,在产线上“打螺丝”赚取微薄的薪水;第二,用这些可怜的工资再把自己做的产品买回去。。。
你看,那个被无数人怀恋的1997,其实也并没那么温柔缱绻,细想起来挺憋屈。可话说回来,谁让中国制造业又没产线又没技术又没人才呢?这事儿咱得认。新世纪黎明在前,中国大地暗潮涌动,有好几支“不认命”的队伍已经趁着熹微整装出发。其中最为人熟知的一支队伍,当然是中国的制造业企业家。他们大多地处广东或江浙,从最落后的生产线开始引进,从技术含量最低的鞋袜、小黄鸭、圣诞树做起,背负着“中国制造=劣质产品”的嘲讽,开始了孤独而漫长的远行。他们的目的只有一个——有朝一日,要把全球制造业的主导权拿回中国。而几乎在同时,另外一支神秘的队伍也已开跋,那就是“数据远征军”。中国制造业如果想登峰造极,绝不能只靠绞动的齿轮、炽热的火焰和一眼望不到头的工人们用自己的生命年华去冲锋。有朝一日,当制造业的权柄捏在中国人手中之后,蕴含在制造业躯体里的“数据铁矿”和以此锻造的“数据武器”也都要掌握在中国人手中。2004年,他一个猛子跳进了奔涌的互联网大潮,加入阿里巴巴,换上了“行在”这个花名。他和一群老师傅一起摸着石头过河,最终帮阿里造出一套全球最先进的、中国人完全理解和掌控的数据平台。这一战,不仅成就了阿里巴巴鼎盛的“DT 时代”,也成就了“行在”在数据智能领域的赫赫威名。因为在互联网行业,数据之剑的“法力”刚开始显现,当时的阿里就像一个“道场”,还有一万种剑法等待老师傅研习,为啥非要在意兴正浓时跳出聚光灯圈?当然命运的蜿蜒很难用一两句话解释,但如果我们曾站在1997年的“小张”身边,恐怕就能对他后来的选择多一些感同身受:行在虽然把人生最好的12年贡献给了互联网,但他却并没有对互联网“献身”的执念。别忘了他不仅仅是互联网人,更是那个从世纪之初就出发的“数据远征军”的一员。2016年,行在跟一群小伙伴郑重地创立了奇点云,他们的目标是:4)帮助他们把“数据”这把利剑牢牢握在自己手中,披荆斩棘,打怪升级。
在那之后将近五年的时间里,奇点云做得风生水起,用“数据智能”的剑法敲开了零售业、金融业,甚至诸多政府央企的大门,却偏偏一直在绕开整个故事的起点——制造业。在我看来,“制造业”和“数据智能”其实就像一本厚厚小说里的男女主人公,虽然读者都猜测他们最终会在一起,可在那之前,他们却得铆足了劲儿先演绎一些波澜壮阔又相爱相杀的故事。而就在这些故事中,有关我们国家和每个平凡人的命运肌理,也悄然浮现。要讲清楚制造业的故事,你得容我先来一波硬核科普——数据第一性原理。数据说到底不就是一堆数字么,它们为什么会成为有价值的“矿”?我小时候做了那么多数学题,现在不还穷得每天舔酸奶盖么?
如果是一堆编造的数字, 游泳池一边抽水一边放水之类的,跟我们的生产生活没有关系,那确实毫无价值;但如果一组数据真实描绘了现实世界的某个过程,它就有价值。1)一旦一组数据描绘了世界,人们就有办法从中找到规律,从而预测未来的走向;2)对未来预测得越准,就可以越早、越坚定地采取行动;3)我行动比别人快,我就赢了;我行动了,其他人没行动,我就赢。麻。了。
注意,后文我所说的一切数据的玩法,本质上都可以追溯回这个数据第一性原理。到时我就不一一提醒了↓↓↓从这个原理出发,我们再看一下数据技术的进化历程,就会非常清晰:25年前(行在还是“小张”时),数据虽然可以被铸成利剑,但舞剑的仍然是人。从数据里分析出规律的是专家,利用这个规律做出行动的是老板。10年前(行在成为“行在”时),数据被铸成利剑后,舞剑的有两个:人+智能系统。而且,智能系统做出的决策越来越多,人做出的决策越来越少。问题来了:人做决策不是挺好么?为啥要交给智能系统?即便在今天,人脑仍然是地球上最精密的计算系统。但说到底人脑只有二两肉,如果数据量小,人脑的分析能力完胜智能系统;如果数据量超过一个临界值,那么人脑就会爆仓,必须丢弃一些信息之后才能继续思考,这时智能系统的分析能力就会迅速高于人脑。数据量越大,差距就越悬殊。
所以,任何一个行业,想要进入“DT 时代”,一个先决条件就是:拥有大量的“数据铁矿”,这个量一定要大到超过那个“奇点”。互联网行业越过“奇点”,大概是在2012-2014年,而后才有了 BAT 的一骑绝尘;零售业和金融业越过奇点,大概是2014-2016年,而后才成就了各种“超市外卖送货到家”和“手机上的金融服务”。
你有没有发现,这些行业之所以跨过数据奇点,是因为它们“家里有矿”——天然和个人消费者比较靠近,人产生的数据很多,也“狠”有价值。可是,制造业。。。就和那些“富二代”比不了了。。。制造业的上游是原料,下游是经销商,都不是个人,天然就没那么多数据给你折腾。所以,制造业虽然很重视数据,也很早就进入了IT时代,但是它的数据量一直没有暴涨超过临界点,所以一直“趴”在IT时代。。。
冥冥中传出“咔嗒”一声,一个微小的,维持了几十年的天平悄然倾斜,撞倒了第一张多米诺骨牌。那年疫情来袭,各行各业居家办公,对快递外卖的需求暴涨,与此同时很多工厂停工,赋闲的工人们转而成为外卖员。大量产业人口快速转移,像一个急浪,让本来就稳步上涨的工人工资出现急速抬升,迎头撞上了因为国家政策鼓励和技术进步而迅速下降的机器人成本。于是,一些原本还犹豫一下是“让人干”还是“让机器人干”的事情,从那一刻起,已经可以毫不犹豫地交给机器人来干。工序越是精密,人来干的失误率就越高,机器人相比人类的优势就越大,机器人化的浪潮就越快。于是在2020,电子制造、光伏、电池、半导体、医药等等领域,无数机械臂、自动运料车、一体化产线被一股脑送进了大小厂区。别忘了,这些机器人可都是物联网(IoT)设备,它们在工作时,不仅能实时记录“手中产品”的状态,也能时刻记录“自己”的状态。这些状态都是数据,而且是真实描绘现实的数据。工厂24小时不休不眠,数据就24小时不间断地产生!从天空俯瞰,2020疫情的肃杀之下,精密制造业的数据却如寒武纪一样炸裂,一下子冲过“奇点”,加入了“家里有矿”的行列。彼时普通中国人的注意力200%都被疫情死死吸引,自然对这一切懵然无知。但有一些人却嗅到了这个千载难逢的机会,那就是一直站在奇点旁边的人——行在和奇点云的数据铸剑师们。这不,2020年,小区刚刚解封,行在就亲自出马,坐在一家全国知名的电子制造企业的办公室里。为了行文方便,我们就叫它A企业吧。A企业的数据总监提出的要求很明确:“最近我们的数据量突然变多了,原来一分钟就能算出来的报表,现在都得十几分钟才能算出来,你们能不能把底层数仓系统改造一下,让我们算数快点?”行在听了,哈哈一笑:“你这要求是‘基本款’,我们肯定能做到!其实咱们还能进一步。。。”他向前探探身子,“如果把各个系统的数据打通以后,我们还能自动预测每笔订单的交货时间,帮助你们更好地排产,更快地交货,这个功能你们想要吗?”因为对方的数据量已经越过了“奇点”(而不自知),行在肯定不满足于仅仅给对方一把“剑”(IT),他想做的是直接搞一套“智能系统”,帮他们舞剑,一波带进DT时代!对方一听,口水流下来:“从订单到交货?这,能做出来吗?”老实说,这其实是奇点云的第一个制造业客户。虽然行在拍胸脯,但制造业毕竟不同于零售和金融,它内部的数据关系极其复杂 ,到底里面有啥“神坑”,谁也说不好呀。。。来,我们把镜头转向命运的大坑,坑旁边站着一个人,对即将发生的事情还懵然无知,此人就是航宇。学霸也分很多种,有些“理论派”学霸喜欢把炫耀当成目的,可航宇却是“实干派”,他把解决问题当成目的——他关心 Why,但更关心 How。你看,他本科时学的是汽车机械,研究生又转到工业软件方向,这都是社会主义现代化建设过程中最“解恨”的专业。2009年硕士毕业后,他自告奋勇加入了国内著名的数字化咨询企业汉得信息。由于他的学霸人设,当时都没有走培训流程,直接进驻了一个做电梯的企业甲方,帮他们升级 IT 系统。很快航宇的凶悍之处就开始显露——他可太沉得住气了——跟着这家电梯企业“上上下下”了4年,期间经历了系统建设思路反复讨论、调整,更迭了好几次,才终成正果。看到这些过往,你大概会对他的“超能力”有点感觉:航宇不仅一直站在制造业身边,庖丁解牛一般理解制造业 IT 系统的技术细节,更稀罕的是,他对制造业企业一路跋涉的“历史足迹”有切身的体感。当时的进度是:A企业刚刚圈定几家意向合作伙伴,奇点云只是其中之一。对方让大家是骡子是马先拿出方案看看。。。要命的是,有一位竞争对手很厉害,它不仅服务过制造业,而且它就是从制造业企业孵化出来的。。。相比之下,奇点云虽然自信在底层技术上无人能敌,但毕竟制造业的行业经验有限——很多术语、数据结构方案团队都得一边学一边弄,压力山大。航宇一看,嚯,这不是撞枪口上了吗?制造业我可太熟了,我来对接!果然,航宇一顿神侃,跟A企业交流完全在一个频率上,加上行在之前画的“饼”比别人都香,最终奇点云有惊无险地从诸多强手嘴里抢下了这块“肥肉”。话说这个项目看上去是肥肉,可一口咬下去。。。里面全是钉子!就在航宇带着奇点云的精锐工程师进驻A企业后,他的头瞬间大了三圈。。。你还记得“数据第一性原理”吧。要想从数据中得出正确的预测,得满足三个先决条件:不吹不黑,这家企业是行业翘楚,在数据方面已经做得很好了,但很多细节仍然没满足这三个条件:某个元器件有两家供应商,互为备份——如果甲供应商交货延迟,就可以用乙供应商来顶上。这个事儿归一位专门的负责人管理,每当他觉得甲供应商要出幺蛾子,就直接联系乙供应商发货。看上去很正常,但你发现问题了没:无论是供应商的数据,还是判断的逻辑,都在这个负责人脑袋里,对于数据系统来说,他是一个“外挂”,是离线的。于是航宇他们赶紧写了好多界面,让相关负责人把脑袋里的数据统统补进系统。有一个零件的库存系统里,设置的安全库存是30件。如果库存少于30件,就会提示补货。航宇就问负责库存的同事,这里为啥是30件。对方说,不为啥,因为上一个同事就填了30件。一圈文下来,居然没人能说明白这里为啥是30。。。航宇他们只好把企业里的供应链专家拉过来,重新讨论这里安全库存的判断逻辑,然后重算新值。新值不仅填的有道理,还能随生产节奏或季节的变化而调节,它被“救活了”。在制造一台手机的过程中,有两道工序都需要同一种原料。可是这两道工序没有“相互通气”,它们分别填写了采购需求,在填写的时候,为了保证生产,自然要留出一些冗余嘛。可问题是,如果两道工序共用一种原料,他们就应该一起订货,并且合用一份冗余就够了呀!因为这两个工序是独立进化出来的,没人做过统筹,所以它俩根本不知道对方的存在。奇点云的老师傅就得在这两个数据库中间建一座桥,打通这些“孤岛”。你发现没:填写数据、改正数据、打通数据,事儿都不难。难的是你得找到该填哪些数据,改那些数据,打通哪些数据。每当这个时候,航宇过去十年的修炼的“超能力”就灵魂附体——因为他曾跟着很多制造业企业一起建设过IT系统,了解它们的“历史包袱”,什么地方容易出现数据错漏,掐指一算,就八九不离十↓↓↓客户看到的是,每天跟航宇商量,他都一副羽扇纶巾,胸有成竹的亚子;客户没看到的是,每天晚上下班以后,才是航宇一身冷汗的时候。。。因为除了航宇以外,奇点云其他的工程师老师傅对制造业都太陌生了。举个栗子,采购订单里有一项参数应该叫PO行(hang),可不熟悉的人会错念成PO行(xing)。你可能又会吐槽,念什么不吃饭啊?把活儿干了就行了呗?并不是这样。你是去服务企业的,理论上你应该比企业更懂才有资格服务人家,可是如果连最基础的词都念错,你后面再说啥人家都不想听了啊。。。比如,制造业的数据库格式也和零售业不同。制造业有很多“大宽表”,在建索引时用标准的探测器直接去探测,效率就很低,得专门为制造业调整参数后才好用。总之当时的局面是:老师傅虽然“铸剑”技术一流,但是必须得学会制造业的领域知识,才能让铸出的剑更顺手。于是那几个月,航宇每天白天带着老师傅在客户现场部署,到了晚上就拿出小本本开始“制造业大讲堂”——今天学的知识明天就考,还不能错,压力简直比高考还大。功夫不负苦心人,老师傅死去活来三个月后,突然发现自己可以跟A企业的同事谈笑风生了。别忘了他们是干啥来的,把数据打通只是基础,怎么在上面做出对生产的预测,缩短“从订单到交货”的周期,才是摆在他们面前真正的考题!这事儿,地球上就几乎没人干过,老师傅也得摸石头啊。。。当时航宇坐镇帐中苦思冥想,把脑袋里十多年的经验又榨取了N遍,想出的方案总是不太满意。不过在他和技术老师傅聊天时,总听到他们张口闭口都在讲一个词——“埋点”。简单来说就是:在系统产生关键数据的地方,放一颗探针,用探针把这些关键数据“扎”上来,系统就能对它们进行联合分析了。既然“埋点”的思路在互联网、新零售、金融领域都成了通用玩法,那在制造业能行得通吗?“从订单到交货”本质上也可以抽象为一个工作流,其中包含了运营、计划、生产、仓储物流、财务结算等等模块,每个模块在运转过程中又可以分解为很多固定的“动作”。在这些动作里都“埋上点”,不就能构建出流程的全貌了吗?这个思路表面通顺,但仔细一看有个 Bug:制造业企业在进化过程中遗留了一个“缺陷”,由于数据长期分散在各个系统里,导致每个系统对同一个“动作”的定义不一定相同。比如“客户下单”,有的是通过线上下单,有的是邮件,还有电话、传真下单;比如车辆发货,仓库系统认为出了仓库大门就算发货,运输系统认为装到车上就是发货,财务系统认为客户确认才是发货。
“但无论怎样,只要各个部门坐在一起商量,总能定义出一个动作,就叫“订单生效”,也能定义出一个动作,就叫“发货成功”!”航宇想。他想办法把流程中涉及到的7个部门的经理都请到一起开会,就干一件事儿——把上百个关键“动作”都摆在桌面上,挨个统一定义。话说,7个部门的大佬聚在一起掰扯,那场名蔚为壮观。但只要他们“打”成一致后,接下来植入探针的工作就是洒洒水了——整个制造流程中的关键数据被密布的探针穿成一个渔网,只要提纲挈领,不就能一把抓起了吗?!没有数据平台时,7个部门经理的眼里只能看到自己的那部分系统,想替整个流程操心都操不了;现在有了数据平台,他们的视野一下子拉开,所有人眼里都看到同一张“大图”,各自负责的那部分在大图中所处的位置也清晰可辨!在同一张图的基础上继续探讨,就很容易发现“全局策略”:比如,X订单突然要加急,加塞在Y订单前面,那么不仅是制造排期要调整,X订单用到的原材料也得赶紧进货,哪怕价格稍高一点儿也能接受;比如,有一个元件的库存目前比较高,按理说应该降低库存以节省成本,但Z订单优先级突然调高,要保证100%按时交货,此时就不能降库存,而应该用库存冗余来换取交期时间缩短。
只要把策略都编成代码,放在数据平台上,让机器人(在专家监督下)执行,不就能实现“订单交期”和“成本”的智能平衡了吗?更厉害的是,这些策略在平台上运行是完全透明的,7个部门的老师傅都可以看到。他们可以根据策略运转的情况,结合自己部门的经验继续改进这些策略,从而让策略“循环迭代”,交期越来越短。话说,本来这个项目几个月就能干完。可是,奇妙的化学作用发生了:随着每天开会讨论,7个部门经理对数据平台理解越来越深入,逐渐意识到这玩意儿比他们想象中强大得多,于是自发想出了很多新点子,希望在自己负责的系统内部多加一些组件,以便观察更细致的指标。一位经理说得很实在:“如果不把这些指标搞出来,我怕跟不上我们老板数字化的节奏啊。。。”于是,在第一期底层数据平台还没搞完时,A企业就直接揪住奇点云续签了两个新项目,“采购数据子平台”和“质量管理数据子平台”。三件事儿加在一起,从2020年12月,一直干到2021年10月。好家伙,老师傅去的时候是冬天,回来的时候又快冬天了。这一年打了无数“怪兽”,不仅是航宇,还有项目团队的所有老师傅,经验值都飕飕地飙升。项目验收的时候,行在也跑去了现场,一是为了感谢客户信任,二是要亲眼见证“项目最终效果比他2020年画的大饼还要大”是一种怎样的体验。。。目睹A企业同事们脸上的激动,行在意识到一个严肃的事情:制造业即将涌起的“数据智能”大潮,可能比之前预计的还要凶,这种史诗级的历史关头,奇点云决不能当配角,而是要做主演!于是行在火速成立了“制造业产品线”,航宇也顺理成章地成为这条产线的负责人。按理说,在A企业里锻炼了一身腱子肉,后面再服务别的企业,应该能轻松加愉快了吧?其实技术的魅力恰在于此,它有点像我们脚下的大地。每次老师傅们费尽气力建设一个新的技术地层,用户都会迅速爬到上面,提出新的需求。你建设地层的速度越快,用户新需求产生的也越快,这是一个永无止境的轮回。这不,刚站在浪潮之巅的奇点云,马上就得学会在浪尖上“跳芭蕾”。2022年春天,几枚凄厉的导弹划破夜空,俄乌战争拉开帷幕。由于石油价格疯涨,全球对光伏能源的需求暴增,B企业疯狂扩产。一只手数钱数到手抽筋,另一只手却掂着一个“甜蜜的烦恼”:出口到欧洲和美国的产品,有非常严格的标准,其中有一条要求就是:每一件产品都必须能追溯到原料的产地和批次。话说,B企业也是行业大佬,质量追溯体系本来就有。但问题是,2022年他们新建了很多工厂,产能突然打着滚地往上翻,加之国外的追溯要求突然加码,原来自己搭建的数据平台“爆仓”了,算不出来。。。情况危急,他们直接在上海成立了数字化转型办公室,招聘顶尖的技术人才,血本投入。即便是这样,尝试了大半年之后,数据平台的性能还是距离期望有好大一截。航宇去的时候,对方说得很明白:“去年我们自己做了一波数据平台,没做成;后来找了一家公司帮我们做,也没做成。你们是第三波,你们要是失败了,我们还会找第四波。反正什么时候干成什么时候算!”一听这话,航宇马上就明白了:自己遇到了“顶级客户”。首先,光伏是制造业皇冠上的明珠,在所有制造业中它的自动化程度是最高的(之一),数据密度和数据质量无人能出其右;其次,中国大力鼓励光伏产业,企业手握最好的政策资源,往前冲就完事儿了,没有后顾之忧;最后,由于石油价格暴涨,光伏产业刚好站在全球工业的浪潮上,愿意大笔投资未来。
这家企业就像是制造业里的“黄山”。如果它的所有需求都能搞定,奇点云就妥妥的神功练成独孤求败了!他和团队赶紧把之前在企业A里打磨的数据平台拿过来复用。这时才发现,之前的平台还是太糙了。。。如果数据平台只用来“管理订单”,那么它的最小颗粒度就是“一批产品”,只需要在产品批次的“流转动作”上埋点就够了;
但如果用来“追溯原料”,它的最小颗粒度就是所有的原材料,于是除了原有的埋点以外,还需要在每个产品的具体“生产动作”上也都埋点。
这么说吧,如果之前的埋点密度像是纵横的渔网,那现在的埋点密度就像是细密编织的布料。咱们都学过《核舟记》,如果在一块一人来高的木头上雕出个关二爷,那一般的匠人都行,但要在一个核桃上雕刻出苏子鲁直佛印泛舟,那非得“奇巧人王叔远”才行。在某个生产环节上,有三台上料机,两条组装线——任何一台上料机都可以给任何一条组装线上料。要解决这个问题,要么就再加两条生产线,让上料机一对一服务;要么就在三台上料机和五条生产线上全部埋点,精确记录每一次供料的详情。这还仅仅是最容易理解的例子,真实的生产过程充满了各种难与人言的“数据断点”。搞这种事情,几乎没有好办法,只能是奇点云的老师傅和B企业的工程师们每天坐在一起开会,像做卷子一样一个问题一个问题地解。航宇记得很清楚,他们驻场在B企业的几个月,经常在一个大会议室里讨论。会议室有三面墙都是整块的玻璃,可以用马克笔写字。每次开会都是所有玻璃从左上角写到右下角,密密麻麻全部写满。等到两周以后下一次开会,又是所有玻璃都写满。有趣的是,就在这个项目进行的2022年,奇点云团队的老师傅们早已不是那个不会读“OP行”的行业小白了,而是个顶个的满级专家,跟对方讨论的时候专业性一点不落下风。有时候人家说了个什么意见,奇点云的老师傅直接站起来,给人家来一顿科普,争得面红耳赤。。。这种情况一多,B企业的工程师都懵了,到底谁是甲方啊?!我开会总跟大家说,我们帮人家做事情,“思考”是很重要的。但有比“思考”还重要的,其实是“驱动”。“思考”大多是被动的,客户提出一个什么问题,我们来思考怎么解决。但“驱动”是我把我能想到的问题也摆出来,和客户一起解决。当你把驱动力展现出来的时候,表面上可能是和客户争论,但本质上,这表明了你懂行业,你不仅有和客户对话的资格,更有帮助他转型的资格,这恰恰是客户对你产生信心的一刻!
回到我们的故事,奇点云和B企业的老师傅手拉手埋头苦干,终于把沉甸甸的数据平台搭建完成,大伙儿像火箭点火一样,眼含热泪郑重启动。瞬间,平台上的数据像春天原野上的草一样,疯狂生长,细密编织,每一件产品的前世今生都能被看得清清楚楚。萦绕在B企业心头一年多的产品追溯难题,终于解决了!就在大家欢呼雀跃时,很多人都注意到了一个“One more thing”:过去一个工单下达之后,老师傅就只能在一旁“看热闹”了,只能等到所有工序走完再来“拆盲盒”一样复盘效果。现在由于所有中间节点的数据都完全透明,仿佛车间里突然有了“X光”,原来笼罩在黑盒子里的“生产细节”都在大屏幕上一览无余。如此一来,在生产的过程中就能介入调整,从而提高生产效率。这可不是开玩笑:产线效率每提升一点儿,就是多赚一笔钱啊!很快,B企业的几位生产负责人就组团找到航宇,提出一个紧急要求:我们能不能提高数据更新的频率,从一天一次,变成一小时一次啊?!这样就能做更多的“微操”啦!生产负责人就把数据收集和计算的频率直接调高了24倍。话说,DataSimba 在设计的时候是非常考究的——为了保证绝对稳定,会在工作载荷的基础上留下10倍的冗余量。可是。。。10倍的冗余量,架不住24倍的计算提升啊。。。最先发现有点不对劲儿的,是B企业的几位工程师:咦,以前这时候数据已经出来了,今儿怎么还都没看到?找奇点云同学一看,我勒个去!!!凌晨时分出现一波计算任务的超大高峰,现在后面的任务已经拥塞,排队能绕了地球三圈了——数据平台分分钟有种想躺平的意思。。。这显然超出了现场团队的能力范围,紧急任务直接怼到了 DataSimba 平台的开发团队负责人,也就是奇点云的技术一号位,地雷眼前。如果你质疑他长得不帅,他虽然完全不同意你的看法,但也能呵呵一笑不跟你计较。但,如果你胆敢质疑他和团队的手艺不到位,他能几天不睡觉来证明你是错的!!这不,当时正赶上2022年12月疫情放开,地雷刚阳了,躺在床上额头烫得能煎鸡蛋,就听到前线传来消息——DataSimba 快顶不住了。地雷直接“垂死病中惊坐起”,爬到电脑前面,用“含着刀片”的嗓子跟大家开会。因为 DataSimba 是奇点云部署在各行各业的通用底层平台,地雷之前并不会特别把注意力倾斜在制造业上。这次紧急支援,他分析了一下B企业体内 DataSimba 的运转情况,然后直接惊了:“制造业的数据量居然这么大!和零售、金融完全不在一个量级。”你想想看,B企业是光伏制造企业,光伏企业的特色是“垂直整合”,意思是从原材料开采,到半成品切方,到成品制造它都干。每个工序都有专门的工厂负责,每个工厂的制造、仓储、运输又几乎全部是自动化的,而每个自动化设备都在24小时源源不断地产生数据,加在一起,这数据量能不逆天么?“既然数据比想象中多,那加几台机器不就得了?”我问地雷。并不是每个小时的计算量都超过系统负载,而是只有凌晨3:00-4:00、5:00-6:00两个时间段超过了负载。这就意味着,如果能够巧妙地削平一天当中计算量的波峰和波谷,现有计算力还是够的↓↓↓地雷曾经供职阿里巴巴,在他看来,这个事情和“双11”有点像。如果土豪不计成本,买几十万台服务器,肯定能扛住双11那天的峰值。但如果当年阿里巴巴那样干,不仅服务器的成本直接爆棚,更失去了对阿里云、数据库、大数据平台等等一系列技术进行磨炼的机会。况且,过去几年,DataSimba 还有个主线任务——要不断减少单位任务需要的计算力。2021年时 DataSimba 部署在企业里,最少都要11台服务器;2022年中,已经变成了最少6台;这件事儿发生时,地雷他们正在尝试把最小服务器数量压缩到2-3台。虽然问题很棘手,但地雷摆出一副蔑视的表情。这一方面是因为他阳了眼睛不大睁得开,另一方面,其实他手里有个“大杀器”。简单来说,元仓体系就像是数据平台的神经系统,它可以对平台自身各个细节指标进行观测,然后汇总起来进行健康分析。(你也可以把元仓理解为“数据生产线”自己的埋点和指标)话说,以往的数据平台根本是没有“神经系统”的,因为不需要——反正平台上跑的数据都没那么重要,即便出点儿问题也不会死人,修好就行了,为啥要煞有介事搞一整套神经系统嘞?!他老早就断言,数据平台一定会进驻越来越重要的场景,有朝一日,数据平台挂一秒都会要命,不允许“先坏再修”。这不,就在2022年底,“元仓体系”刚刚开发完成,正在秘密测试中。新鲜出炉的“元仓”接入B企业,很快,“神经系统”返回了很多指标,真相随之一点点勾勒出来。为了让你感受到这里的硬核技术之美,我决定给你讲几个真实的细节:1、比如“作业最晚执行时长”这个指标,它能找出成千上万个作业里,最后做完的那一个。通过这个指标,地雷他们发现,在1:00-2:00这个时间段内,最晚一个搞定的作业居然拖到了2:15——和下一批作业重叠了。但拖延的原因并不是因为这个作业真的很难,而是调度过程中策略有些松散,给了它机会“摸鱼”。2、还有“等待资源的作业数”和“执行中的作业数”这两个指标。这两个指标对比一看,地雷他们很快发现,有个别任务一直在门口排队。仔细一排查,原来是这个任务和某项配置“八字不合”,导致它每次都会卡顿。过去计算没那么密集的时候,它卡半个小时一使劲也就过去了,现在计算密集,它再卡半个小时,后面的队伍都憋疯了。。。3、再比如“调度执行时长”和“作业执行时长”,这两个指标分别显示了一个任务“单纯在调度阶段的耗时”和“总耗时”。显然对于所有任务来说,调度花的时间都不应该占总时长太大的比例。但查看指标,发现有一些任务的主体计算早就做完了,但是系统对它的调度却一直没停。这太反常了。根据这个线索,地雷发现问题出在了“交作业”这一步——提交结果的时候,一个日志接口优化不够,出现了给老师交完作业还得在学习委员那排队“登记”的情况。地雷告诉我,当时大部分的问题改起来不困难,但也有个别问题很棘手,他们甚至得进入 Java 虚拟机,把人家内存释放的算法都给魔改了一通,才终于搞定。话说,回到历史的现场,“技术的困难”倒还在其次,主要的问题是“身体的困难”。问题排查前后经历了10天,可是,在那个特殊的时期,却没有一个人能撑过10天。。。DataSimba 的首席架构师鱼飞最先扛旗,可是才扛了两天,他就阳了,高烧不退,眼看就有烧糊涂的趋势。二号位的架构师明瑞赶紧自告奋勇:“我来!”明瑞扛了一周,解了无数 Bug,眼看胜利在望,他也阳了。。。赶紧把没解决的问题“托孤”给第三位架构师。眼看元旦假期到了,可事关B企业的生产效率,分分钟几百万上下,客户非常着急,两边老师傅谁都没放假,一边线上开会,一边咳嗽此起彼伏。就这样,这场从一天算一次到一小时算一次的“地狱升级”终于被扛下来。B企业领导非常开心,揪着地雷问:接下来我们准备把计算密度再提升12倍,从每小时一次变成每五分钟一次。再给你们10天,能干完吗?如果计算密度再提升12倍,那连底层的计算引擎都要从离线引擎换成流式引擎,所有查询语句都要针对新引擎重写。虽说技术上没有不可逾越的难度,但毕竟相当于把汽车改飞机,肯定不是10天能搞定的了。劝了半天,对方领导才同意稍微缓缓再干。那天加班到很晚,地雷坐在空荡荡的办公室里,心底却突然涌上甜蜜。你看,无论啥行业,数据平台上必然有很多计算任务是每天一次的,只有在夜里12点以后数据才凑齐,才能开始算。所以,负载高峰一般都出现在后半夜,万一出毛病。。。也很可能在后半夜。。。每当这时,蝙蝠侠就来活儿了,他们昼伏夜出,半夜帮客户平事儿,清晨第一抹阳光照耀大地,数据平台恢复如常,蝙蝠侠们事了拂衣去。因为数据平台嵌入了生产的“黄金流程”里,生产一秒不停,数据平台也一秒不能停。这种情况下,就算蝙蝠侠凌晨三点“起夜”也没戏。数据平台必须从“起夜级”变成“企业级”——不仅不允许分秒卡顿,还要有超强的自愈能力,最好像太阳一样,永远热烈,永远照常升起。为了实现这个 Mission Impossible,2023年5月,地雷团队把“元仓体系”正式挂载在数据平台中,可以通过“体征”变化而提前发现异常,治于未病,争取达到扁鹊他大哥的效果。拿着闪闪发光的数仓,航宇他们终于可以放心大胆地用各种姿势征服一个又一个客户了。航宇告诉我,截止2023年夏天,奇点云已经累积服务了几十家制造业企业,这种“遍插红旗”的速度,比当年攻克其他行业都更迅猛。但另一个烦恼也随之而来:客户太多,行业专家不够分了。航宇干脆牵线搭桥,把自己的良师益友,也是另一位“远征军”云风介绍给了奇点云。当年航宇之所以坚定地投身制造业,就是因为校长去学校做宣讲招聘,让他深受鼓舞。校长1998年加入汉得,很快就在公司内部开设了“黄埔军校”,专门对新来的同学进行“魔鬼训练”。在他手中,一批批制造业的专家被培育出来,源源不断进入了中国的各大企业,成为制造业数字化建设的重要力量,可谓桃李满天下。行在三顾茅庐,邀请校长加盟,他对校长郑重地说:“你是老革命了。但老革命要装备新武器!在奇点云,你手上会一直有最先进的武器。”后来行在告诉我,他其实跟每一位行业专家都是这么说的。。。这倒不是行在不走心,而是因为这是一句郑重的承诺。用岁月去践行的承诺,有一句足矣。校长坐镇,开始为奇点云培养大批行业专家,这些行业专家进入不同的制造企业,各自发掘出各种更深的数据应用场景。在我们之前提到的A、B两个企业中,数据平台的作用都是提高“效率”。但是,如果把数据的触角再深入一层,到达每一台机器里的每一个参数设置,就可以直接提高生产的“良率”。其实,每一条生产线在生产一批产品前,都需要请来一个神秘的老师傅,让他根据现场情况对机器里成百上千的参数进行“调参”。这些参数如果配合合理,能让产品良率大大提升。但是调参是个手艺活儿,主要凭手感,经验来自于老师傅几十年的积累。如果人工智能学会老师傅的调参技巧,再利用数据平台接管这些参数,就可以直接成为AI老师傅,虽说和人类顶尖高手还有差距,但是比肩2-5年的师傅是很有希望的。如此一来,机器就可以把各种产品灵活地混搭在一起生产,根据当前的产品类型和自己的工作状态实时调整自己的参数,每一个刀锋和齿轮都仿佛有了灵魂。你还记得吧,奇点云服务的大多是“顶级客户”——各个细分领域的龙头企业。这当然是因为龙头企业敢想敢试,也有试错的勇气和成本。但反过来看,如果期待中国制造业整体飞跃,只有龙头企业往前冲是肯定不够的。有朝一日,“金字塔”腰部和底座的中小企业能够享受数据智能的荣光,中国制造业才能告别浓烟和汗水,迎来真正意义上的产业升级。中小企业一般利润不多,预算有限,肯定不能让工程师驻场几个月来一场“脱胎换骨”。他们需要的是更简单的,拆盒就用的数据产品。为了做出这样的产品,校长正带着一群人闭关修炼,试着把来自几十家制造企业的经验汇总起来,抽象成一个个“乐高积木块”。期待有朝一日,所有中小企业需要的数据平台,都可以用其中一部分积木拼插而成。为了打磨数据产品,校长会经常找机会和各家企业的CIO(首席信息官)聊天。原来, CIO 只负责 IT 系统建设,所以只研究代码就够了;现在,新一代 CIO 肩负企业数据智能转型的使命,他们不仅要懂代码,更要懂数据,而要想理解数据,首先要深刻理解业务。
这群又懂业务,又懂技术,又懂数据价值的人,正在每一个制造企业崭露头角,成为中国制造业的中坚力量。从天空俯瞰,两支分头出发了20多年的远征军正在会师。左边,中国企业家们用微薄的利润不断滚动,逐渐装备了最先进的生产线和制造工艺,让“中国制造”成为优质的代名词;右边,“数据远征军”们去各行各业卧薪尝胆,带回最强的数据平台和智能技术。出走半生,他们重又相逢。航宇告诉我,即便他站在制造业最前沿,也没办法望断数据技术的尽头。后来数据平台帮能预测交期,大家又在想如何优化交期?交期优化了,大家又想预测两个订单摆在一份产能面前,我该接哪个更好?能够匹配订单之后,大家又在想能不能让系统自动排列订单?
然后大家又会想,下游的物流应该怎么调度才能效率最高?如果这个也能做到,大家又会想,能不能把良品率提高万分之一?再提高万分之一?
你看,从“数据第一性原理”出发,对未来预测的准确度如果达到90%,还可以向99%进发,然后还可以向99.9%进发。即便你手上有海量的数据,预测的准确度也永远不可能达到100%,因为那是上帝的领地。但每精进一点点,你都会得到应有的回报,并为此欢欣鼓舞。临近告别时,我随口问地雷:“你们为什么能做成这件事儿?”我有一个朋友,当初跳槽到 Google,他设计系统的架构让美国工程师感到很惊讶。对方问他为什么这么设计,他说,因为我见过“双11”。我们首先生在中国,然后才有机会面对这么完整的工业体系,面对这么大量的自动化产线,面对这么丰富的数据场景,才有机会遇到这么多愿意出钱探索数据智能的企业,才有机会遇到这么多极致的需求。
他语气很平静,显然这是经过无数次思考后的最终答案。为了置身绝美的风景,他们有时会迷路,靠手里小小的指南针猜测方向。但终究他们一次次远行,又一次次安然返航。25年前,他身边几乎所有的数据都属于外企,而如今,数据平台技术、数据本身、数据所栖息的数据库,甚至产生数据的生产线 MES 系统也都在一点点被中国人理解和掌握。这是另一场更漫长的,用生命时光才得以丈量的中国数据技术的远行。两千年后,一群赤子正带着有关中国数据的一切,赶回故乡。
回首向来萧瑟处
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
文章来源: http://mp.weixin.qq.com/s?__biz=MzU0NDEwMTc1MA==&mid=2247521949&idx=1&sn=bbca964194ed4c60ad7329739f1f49c0&chksm=fb039284cc741b92d68c9569fb22f97521c1a56c797259efed1f85a0fecf7cfca77e94bf9751#rd
如有侵权请联系:admin#unsafe.sh