ChatGpt会让大多数人失业并非危言耸听。目前,除了精通AI领域加上了解各行业业务领域知识的人,其他非专业领域,就算是科技行业的很多人也难以理解ChatGpt目前的业务运转形态。
我们可以用另外一个方式去理解ChatGpt,它实际上是一次大型AI实验诞生的模型,无意中出现了超出所有人预期的生成和推理能力,并且发展出了一种上下文自然语言编程的方式,其上文包括数据和提示词,下文按提示词语义生成,可以把每次推理会话都想象成在调试控制上下文的生成。
但这种编程方式最重要的技术瓶颈还是上下文大小限制,这种编程的推理生成空间是有限的。例如GPT-4一次推理会话生成的极限为32768个token/131072字节(包括输入的上文和输出的下文),用更抽象化的方式表达这个上下文推理生成的限制,可以把它想象成GPT-4模型在推理生成一个此消彼长的太极数据,由于可推理和生成的上下文是定量的,上文占据字节太多,则下文能生成的就变少。
再举一个简单的例子方便大家理解推理生成,ChatGpt的每一次聊天会话中,每一句提问和回答都是一次单独的推理会话。聊天期间每次新的提问,实际上都是把之前所有的聊天提问回答过程视为上文重新输入,以进行推理生成。你的提问实际上是在进行上下文的滚雪球,直到最后一个提问聊天滚到32768个token的推理生成空间限制。为了进一步缓解上文抢占下文的推理生成空间限制,企业可以做自己的业务数据微调模型(约束领域知识)或向量数据库(向量化扩充上文),但这部分的定制上文数据涉及企业自己的数据安全和隐私。
ChatGpt的上文输入数据因为其强大的推理能力而存在无限可能,上文可以是机读数据(代码、非结构化数据、结构化数据等)和自然语言(各国语言),下文不过是按你的要求生成。目前的开发者正致力于解决如何将业务应用在实践中的问题,对于上下文大小限制不敏感的业务,它们直接成为了各种AI工具。而上下文大小限制也无法阻止各领域业务的落地应用。例如,开发者们正在研究如何将目前这种有限字节的推理会话封装成可以处理复杂数据管道的工作流,一场前所未有的行业革命正在袭来...
未来已来,落后就会挨打~对于大多数人来说,在这些AI业务飞速落地成熟的过程中,资本家们早就在摩拳擦掌了,大多数岗位的失业不过是时间问题。当然,最后这里还存在一个致命问题,大模型的核心推理能力居然在一个半商业化机构手中~知识是没有国界,但知识财富的权利人有自己的祖国