大语言模型作为操作系统级的技术革新,在 2023 年涌现出强大的理解和推理能力。在大模型走向日臻完善的过程中,相信 AGI 的先行者已经率先把新一代技术底座融入进产品,来增强个体的人生。两个月前,极客公园从产品力、商业模式创新、商业价值创造三个维度寻找+大模型的先锋实践。通过征集发现:在一个个具体而微的场景中,创业者们逐渐迭代出有效的路径和解法,把大模型「多、快、好、省」地变成了生产力,进入到各行各业。这一年,尽管 AI 原生的 Killer App 尚未出现,创新的商业模式仍在探索,但这些创新者作出了共同的选择——找对场景,把大模型技术和实际产品正确「对齐」。这些实践均使用了大模型今天相对成熟、稳定的能力,通过将其产品化,在适配的场景带来了效率的提升或更好的解决方案,形成了有效闭环。相应地,「对齐」的动作,也为产品赢得了更好的用户活跃度、产品收入等可计量的增长。比如:- 在企业场景,也许大模型的纯度不高,但依托自然语言做意图理解,对齐到正确的场景和产品上,便收获了客户和用户。
- 在创意场景,基于大模型压缩的世界知识,生成各种形式的内容,直接向个体交付生产力价值。产品差异背后,是对基座大模型能力、工程手段、场景数据的多重考验。
这是+大模型第一年,创业者面对的核心问题是:把当前的技术和产品做对齐。这些先锋实践是怎么做的?2023 中国「+大模型」先锋案例 TOP 10(按企业名称首字母排序)如下文所示:出门问问基于自研的通用大模型「序列猴子」推出了「魔音工坊」AI 配音平台,将大模型能力落地配音创作场景,降低配音创作门槛,丰富配音玩法,提高了行业效率,并为未来打造多模态 Agent 提供了支持。「魔音工坊」是一款集文案写作、配音和剪辑为一体的 AI 软件,其声音商店拥有千款 AI 音色。其中独家首创的「捏声音」功能,可以像使用 Word 编辑文字一样编辑声音。通过「魔音工坊」的声音克隆技术,只需录制 20-500 句话即可定制出与真人声音媲美的 AI 声音。在新华社新媒体中心 AIGC 工作室和出门问问的合作案例中,新华社微信公众号的「夜读」播客栏目有了更具情感的 AI 配音。媒体提供有声主播,「魔音工坊」提供声音克隆技术,并通过情感迁移等技术使声音具有不同的情绪。团队只需输入内容文案,选择已经克隆好的音色,即可快速进行配音。截止案例征集时,「魔音工坊」公开显示在海内外拥有超过 600 万注册会员,其中付费会员超过 40 万。除了声音创作能力,出门问问还将继续基于包括 AI 配音助理「魔音工坊」、及海外版「DupDub」、AI 数字分身「奇妙元」等在内的一站式 AIGC CoPilot 产品矩阵,打造具有声音和形象的可交互、多模态和可学习的 Agent,也为中小企业客户打造高质量的 CoPilot 应用,企业 AI 数字员工「奇妙问」。Fanbook 由创梦天地开发,作为一个支持千万用户高效运营的社区管理平台,Fanbook 的社区运营场景天然形成了一个「自产自销」的闭环模型。Fanbook 不仅能高效聚集大量用户训练大模型,还有许多运营和内容创作场景需要应用大模型能力。因此,Fanbook 迅速引入了生成式 AI 技术,如文生图、图生图、文生视频等,已经训练出了大量 AI 绘画模型。这些大模型的引入大大降低了创作者的生产门槛,减少了工序性的人工消耗,同时也减小了工具和技术层面的差异,让创作者能够获得更多的创作能力和自由。Fanbook 应用大模型能力的场景包括 AI 教育、AI 舆情管控、AI 智能客服等。例如,AI 教育场景中,可以应用于学生学习 AI 创作、分享成果、管理学生社区等。AI 舆情管控场景中,AI 机器人定期总结游戏社区中玩家讨论的话题,帮助品牌方更好地掌握舆情走向。AI 智能客服场景中,可以帮助品牌方训练其独有的智能客服机器人和 NPC,并投放到 Fanbook 社区中,与玩家进行问答互动、情感陪伴。截至目前,Fanbook 中拥有 100 万人社区 10+个,10 万人社区 20+个,以及万人社区 100+个。在风变编程的《风变 AIGC 学院》社区中,利用频道功能和 Bot 能力,助力其千万营收的 AIGC 项目在 Fanbook 成功落地。而在《地铁跑酷》社区中,通过使用 bot 和「Tiamat」的 AI 绘画模型,2 天内产生 10 万+ AI 游戏绘图作品。2023 年 4 月 18 日,钉钉率先「+大模型」,推出了钉钉 AI 魔法棒,它是钉钉智能化能力的统称及品牌形象。在魔法棒窗口中,用户用自然语言和它对话,魔法棒自动调用 AI 应用,并提供基于大模型的推理、生成服务,包括问答、聊天、搭应用、算数据等。钉钉作为亿级协同办公软件,每天有无数工作消息、审批、应用等企业数据与服务产生,钉钉 AI 魔法棒的推出让「看不完消息」「找不到功能」「不会搭系统」等行业用户痛点迎刃而解。钉钉在办公协同、业务协同领域的积累,也成为其落地大模型过程中,快速产品化的优势。钉钉面向大模型和智能化场景的产品方案,是一个统一的魔法棒套件。这要求套件内的 AI 产品,能够获取钉钉所有数据、调用钉钉全部能力,从而执行跨多个场景、调用多个 AI 应用、长时段运行的任务。目前,钉钉 17 条产品线已完成智能化再造。比如在服务群问答场景,钉钉魔法棒可以连接企业知识库,基于大模型的推理、生成能力,向客户提供精准的企业知识库问答服务;在工作群场景中,钉钉魔法棒中的智能摘要功能,可以做到「1000 条消息,一秒 get 重点」,根据聊天内容进行主题分类、会话总结,生成待办。钉钉魔法棒通过面向角色的、跨场景、跨应用、跨数据的业务流程与服务,为企业提供了便捷且场景化的大模型应用使用入口,提升了业务流转效率和生产力效率。目前,超 50 万企业组织已启用钉钉 AI。同时,钉钉向生态伙伴和客户开放的智能化底座(AI PaaS)也被广泛采用。AI 写作已成为大模型能力率先被 C 端感知到的场景之一。讯飞写作是科大讯飞基于星火大模型研发的聚焦写作场景的 AI 大模型应用。其既有自研大模型能力,又较早深入场景,使得其 AI 写作产品在市面上具备竞争力。讯飞写作可以帮助用户快速生成各种文本内容,如新闻稿、宣传文案、工作总结和心得体会等。通过对话问答、写作模板等方式,以及利用 AI 工具进行扩写、缩写、改写、续写、校对等操作,提高用户写作效率。此外,在需要结合相关语境及背景信息时,AI 可以通过素材内容学习进行场景匹配。同时,讯飞链接硬软件生态,把讯飞写作产品作为一个平台级产品进行运营。讯飞旗下的多款软硬件产品如讯飞听见、录音笔、智慧屏、麦克风等录音文件可以一键导入讯飞写作中创作,支持一段录音一键成稿、1 个写作产品联动 N 个智能终端。功能上线后,用户的内容提取、内容生产效率大幅提升。在广大的泛文字从业者市场中,讯飞写作已经验证了基于 AI 字符调用的收费模式,并继续提供增值付费权益。Kyligence|Kyligence Copilot(AI 数智助理)
Kyligence Copilot(AI 数智助理)融合通用 AI 大模型技术,提升了 Kyligence 数据指标分析平台的价值——降低了用数门槛、提升了管理半径、增强了智能决策。在数据驱动决策的理念下,数据分析的门槛不断降低,从早期的编程语言和 SQL 查询,到拖拉拽式数据分析工具,再到大模型。Kyligence 精准把握大模型和数据驱动决策场景的契合,例如在图表推荐、指标代码生成、结果可读性和洞察自动化等方面,将使数据分析更加易用。无需复杂的数据处理,只需与 AI 数智助理对话即可完成围绕业务指标的分析和洞察。同时,对话内容可保存成文档或用于创建仪表盘,提升工作效率。在产品上,Kyligence Copilot 采用自然语言的方式,直接基于指标进行跨时间段、跨维度的归因分析,通过目标管理与评估、指标探索分析、智能归因、分析结果的保存四大方面降低用数门槛,提升决策能力。从 2023 年 7 月 Kyligence Copilot 发布到现在,已吸引近 5000 试用用户,并在中国及海外多家头部企业开始商用。落地过程中,Kyligence Copilot 基于客户在不同场景下的需求,持续布局生态。当前,Kyligence Copilot 已成为飞书智能伙伴的内置应用之一。在产业上游,Kyligence Copilot 可以基于 Azure OpenAI、智谱 AI、百川智能等国内外不同厂商的基座大模型灵活调配。在大模型落地到多个场景的过程中,代码自动生成,成为技术实现的必要环节。在这一趋势下,蚂蚁集团基于百灵大模型,推出了蚂蚁百灵研发助手 CodeFuse,帮助开发者自动生成代码、注释、测试用例等,提高研发效率。CodeFuse 源于蚂蚁自身的开发场景及代码库沉淀,基于海量高质量代码数据和代码领域特色词表,和多任务微调技术 MFT,在蚂蚁一万多内部研发人员的日常编码、测试、运维等场景中,经过反复验证与迭代。当前,CodeFuse 从研发效能、DevOps 衍生到了对企业 IT 智能化场景智能体的探索。同时,基于 CodeFuse,蚂蚁集团打造了代码大模型的完整工具链,包括:模型服务、风险防护、数据质量、平台工程。2023 年中,CodeFuse 及其必要的工具链,面向技术社区开源开放,帮助社区开发人员在此之上作研究、评价和二次开发和训练。目前,CodeFuse 在蚂蚁各部门落地支持 40 多种编程语言,10 多个主流 IDE 平台。整体采纳率 30%,代码通过 AI 占比 20%。比如,CodeFuse 在蚂蚁数字科技的 SOFAStack 云原生应用智能商业产品线全面融合,涵盖设计、研发、测试、运维等领域,形成从领域建模到智能运维端到端 Copilot 产品解决方案,提升了企业级应用的交付效率和质量,加速行业数字化降本增效。2023年,美图快速完成了从生活场景到生产力场景的进化:自主研发并发布了 AI 视觉大模型 MiracleVision(奇想智能),并形成了由底层、中间层和应用层构建的 AI 影像产品生态。美图结合长期积累的美学认知和美学创作者生态,为 MiracleVision 搭建了美学评估系统,当前,MiracleVision 在提示词工程和影像生成上,精准匹配了实际应用场景。目前,MiracleVision 已迭代至 4.0 版本,主打 AI 设计和 AI 视频。AI 设计方面,新增了矢量图形、文字特效、智能分层、智能排版四大能力。同时上线全新的视觉模型商店,支持创建个人视觉模型,助力设计师群体实现独特的艺术追求。AI 视频方面,新增了文生视频、图生视频、视频运镜、视频生视频四大能力。目前,MiracleVision 的 AI 视频能力已能融入行业工作流,尤其是电商和广告行业。中间层由美图 AI 开放平台、MCP(美图创意平台)、美图 AI 助手 RoboNeo 组合而成,分别负责开放共享 AI 技术、搭建创作者生态、聚合美图影像服务。应用层面,美图通过 WHEE、美颜相机、美图云修、Wink、WinkStudio、开拍、美图设计室 2.0、DreamAvatar 数字人等产品和服务,在 AI 图片、AI 视频、AI 设计、AI 数字人四大领域创新探索,并由美图秀秀提供 AI 影像服务聚合。美图的 AI 能力将应用于电商、广告、游戏、动漫、影视五大行业,改变原有生产模式,大模型赋能每个环节,实现降本增效。美图的实践表明,用户愿意为大模型带来的创造力和生产力提升付费,以订阅为主要变现模式的影像与设计行业将打开更大商业空间。2023 上半年,美图公司 VIP 会员数超过 720 万,创下历史新高,以 VIP 订阅为主的影像与设计产品业务收入同比增长 62.2%。在信息管理领域,知识管理和效率问题是长期存在的痛点和难点,行业普遍采取「工具+方法」的方式来帮助用户内化知识和提高效率,但往往又容易受制于使用门槛。作为全球领先的信息管理平台,印象笔记针对信息管理场景,推出自研专有大语言模型——大象 GPT,并以此为基础,结合混合部署、RAG、Task Decomposition 等技术,推出了「印象 AI」服务,落地旗下全线软件和硬件产品,成为业界「自研大模型+广泛应用」的第一厂商,为数亿用户提供了更智能便捷的 AIGC 产品和服务,让高效的智能化信息管理变成日常习惯。功能图示:剪藏+印象 AI、印象 AI 助理在「印象 AI」的加持下,印象笔记旗下软、硬件产品完成了创新性升级,从为用户提供可靠的信息存储空间,演进成为用户打造懂自己的、能主动为自己完成任务的专属 AI 伙伴。在实际场景应用中,「剪藏+印象 AI」、「印象 AI-帮我读、帮我写」能够辅助用户完成多模态信息的筛选归类、知识图谱的构建、二次创作等信息管理全流程中的各个环节。此外,即将上线的「印象 AI 助理」还将在保障用户信息绝对安全的前提下,实现「与笔记对话」能力,帮助用户打造融合了个人知识库的 AI 信息管理助理,让个人和企业用户的知识库在流动中不断拓展和完善。功能图示:印象 AI-帮我读、印象 AI-帮我写「印象 AI」通过自有大模型、精准的场景及交互、强大的超级原生应用和庞大的用户基础相结合形成强大壁垒。以「1 个印象自研大模型+N 个优质大模型」的创新性混合部署方案,确保了大模型在应用中同时具备通用性、稳定性和经济性。「印象 AI」的应用落地受到了用户和市场的广泛好评,印象笔记成为了拥有千万级别活跃用户的 AI 原生超级应用,创造了行业标杆性的 AI 服务商业转化效率。大型语言模型必将重塑推荐算法,知乎作为一个拥有大量高质量原创内容的平台,内容的特征会随着时效性和用户兴趣点快速变化,知乎已经率先将大模型能力在内容主题标签建设上落地。基于大型模型的生成能力,知乎将内容主题标签生成的传统分类模型替换为语义检索模型,大幅提升了识别的覆盖率和准确率,并将迭代周期从至少两个月缩短到了双周小版本迭代,并可以微调个性化适配不同业务需求。知乎内容主题标签建设在识别标准方面,已支持 10 个领域知识点(2371 个)和 9 个商业领域知识点(3885 个)的兴趣标签体系迭代,并主动挖掘了 200 多个用户需求的兴趣点。在识别能力方面,内容主题的整体覆盖率增加了 20%,达到 95% 以上,准确率增加了 15%,达到 85%,做到快速响应业务需求。在识别应用方面,已在想法业务的冷启侧、首页推荐侧、问题路由侧以及教育业务推荐侧取得了一定的实验收益并完成了版本升级。这一场景下,大模型能力帮助解决了过往标注成本高、模型训练周期长等用户痛点,有效支持了领域运营、生态及推荐等下游场景的应用。极大提升了对社区内容的理解效率,提升了社区的生产力,同时也让知乎社区生态建设提效,使得知乎的创作者和用户获得更好的内容体验。信息检索和问题解答是企业和个人最广泛、持续的需求之一,智谱通用型知识库问答系统,通过智谱 AI 基座大模型及其工程手段,将大模型的意图识别、推理和生成能力匹配实际场景,让这一需求更自然、精准、丰富地被满足。在模型层,基于智谱 ChatGLM 和 Embedding 技术,该产品适配各行各业的知识需求,即使不通过微调,也可以提供优质的服务。并且,回答严格遵守知识库的内容,面对不能回答或超出知识库范围的问题,会选择拒绝回答,而非杜撰答案,以此保证答案的质量和准确性。Embedding 模型则针对问答场景进行了专门训练,提升知识的实时召回能力,无论用户问题多么复杂或特定,都能迅速地找到知识,提供答案。在产品层,该方案通过问答对话式体验,提供多轮对话、知识引用、问题推荐等功能,并适配了近千种不同的文档格式,对市面上的主流文档类型解析可实现超过 99% 的精度。在用户提问后,该产品可以快速、准确地提取和组织其中的知识信息,实现知识库的快速构建。在场景层,该产品前期已针对各行业知识进行适配,使其能根据不同行业及企业特性快速规模化应用。当前,该产品在超过 5 个不同行业的企业中成功落地,并应用于 10 多个细分场景。在保险、教育等垂直领域,问答准确率可达 90 分以上。目前,这一产品提供 API 调用、云端私有化、私有化部署三种方式。
文章来源: https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653026883&idx=2&sn=ad5a5a241a462a2dfda21e054918378a&chksm=7e5487f549230ee3c23e136a398ac3ea2f3e4dc1a2e650014f892f80f949949392257b9a3d5d&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh