我的 AI 内容总结使用心得:用什么、何时用与怎么用
2024-5-31 11:39:51 Author: sspai.com(查看原文) 阅读量:4 收藏

Matrix 首页推荐 

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。

文章代表作者个人观点,少数派仅对标题和排版略作修改。


为什么需要 AI 总结

每天都有无数的信息涌现,我们的注意力很容易被吸引走,好像了解了很多,但认真回头去想,有价值的信息实在太少了。

人的注意力是有限的,如何利用好它们,尽可能获得高质量的信息一直是我思考的命题。除了主动订阅优质信源,还有一部分就要从各种推荐的信息流里,抽取对自己有帮助的信息。这也成为了我对信息消费的核心诉求。

每天听和看到的内容,主要就是文章、播客、视频。我看文章更多,所以我最优先考虑的就是用 AI 帮我提前阅读一遍,按结构化输出核心观点和全文摘要,我再通过看这些摘要和总结决定是否有必要细读。

为此,我开始体验和寻找当前市面上的 AI 工具,看哪个是可以满足我诉求的。

AI 总结产品体验

我挑选并使用了市面上几款 AI 总结类产品,同时也自己手动去构建了自己的 AI 总结 bot,在这个过程中对自己的需求和当前的 AI 产品产生了一些思考。

现有产品体验

通义智文

最开始尝试体验的是通义智文,丢给它网页链接、PDF 文件、专业论文、电子书,它都可以帮你总结。

但是很快我就发现,它和我的需求并不契合。原因是它只提供了概述和摘要两点,且总结的质量较低,部分我关注的内容并不在它的总结范围内。这个时候就需要我主动去提问,它才能给出相关内容。而我期望的,是给我一个完整的结构化信息,让我基于自己的关注点去展开提问。

当然它也有做得好的地方,比如它支持对阅读内容做笔记、支持翻译原文等,只是不是我需要的。

Podwise

偶然看到了一款 AI 总结播客内容的产品让我眼前一亮,名字叫做 Podwise。产品的 slogan 是也与我的理念不谋而合:Read, before Listen.  

它不仅支持找播客、订阅播客、文字转播客、内容摘要、关键词总结、精彩语录、分享到笔记软件等,最让我中意的是它可以直接用脑图总结播客内容,这个就非常清晰了。有了框架,我就可以对感兴趣的内容进行展开深入。

试用了产品之后,我觉得还是非常不错的,但是毕竟是有免费次数限制(每个月免费使用 4 次),于是我转向了国内的音频总结类产品,阿里的通义听悟。

通义听悟

语音写成文字之后,内容更容易被索引,摄取效率也更高,我能够更容易地找到自己感兴趣的内容。

通义听悟使用下来不如预期,全文摘要、章节速览、发言总结这几个总结功能,结果都比较生硬。再者就是需要我主动再从文本中找信息,而不是将整理好的内容呈现给我。

我尤其不理解,这个通义智文和通义听悟,为什么都这么重视笔记功能,反而不好好做总结。想来想去只有一个原因,那就是底层模型还不够强,只能做些视觉层的功能来弥补模型的欠缺。想到这里我也释怀了,毕竟 Podwise 用的是 GPT-4。

顺便吐槽一下,截至我写这篇内容时,通义智文、通义听悟、通义千问,直接整合为通义了。

Podwise 给我的启发是,AI 总结的内容可以通过更加结构化的方式表达出来,尤其是通过脑图的方式十分击中我,让我可以快速看清内容的结构信息。

由此再结合我的出发点,我的诉求变成了 AI 帮我总结内容并按照脑图的结构输出,或者 Markdown 结构输出。

Kimi

后来等到 Kimi 出圈,我发现前面折腾的这些,Kimi 都可以直接支持,而且表现相当出色。

无论是长文档、文字网页、还是播客链接、视频链接,它都是可以解析并总结,然后按照自己想要的方式展示出来,如展示为 Markdown 或者 Mermaid。

它内容的详细程度可以按照自己的 Prompt 进行定义,当你想要就其中某个知识点展开了解时,可以直接和它继续对话,回答质量也不会太差。再次有了一种如获至宝的感觉。

Kimi 的能力不仅仅是总结,联网搜索、翻译这些都处理得很不错,在内容总结这个场景下模型能力肉眼可见的比通义要强不少。

自己创造

在不断的寻找和尝试过程中,我同时在想为什么不自己动手做一个 AI 应用?想想现在可以通过 Prompt 的方式快速做个 AI 产品出来还是很兴奋的,而不是必须会写代码做程序才行。

Kimi

尽管 Kimi 本身就支持通过 Prompt 的方式实现我需要的功能,但是每次都现发指令去执行比较麻烦。

Kimi 可以通过预设 Prompt 的方式,把常用的 Prompt 设置为常用语,一键呼出使用,十分贴心。想要大模型输出什么样的总结,不断去优化自己的 Prompt 即可。

Coze

Coze 支持用户快速、低门槛地搭建自己的 Chatbot,并且可以将这些机器人一键发布到不同的平台进行应用。

我可以在这里选择底层的模型(免费使用 GPT-4),输入自己的 Prompt(AI 可以帮助优化 Prompt),然后选择对应的插件(AI 可以帮助选择),基本就可以运转起来了。

如果有进一步的要求,可以引用自己的知识库数据,甚至可以通过关联多个 bot 搭建一个 Agent 完成一系列事项。通过预览查看总结的效果,不断调整 Prompt 来达到自己想要的效果。

我的 bot 叫做「阅读先锋」

可以免费使用 GPT-4 Turbo,再加上越来越丰富的插件系统,我打算后面多研究下 Coze,搭建更加个性化的机器人出来,辅助阅读和学习。

使用感受总结

AI 总结的质量很难评,相同的内容在不同的模型上表现有差异,想知道哪个模型总结是相对高质量的(当然当前阶段对比下来明显还是 GPT-4 和 Claude 更强一些),必须自己先去阅读完原内容,再回头去看 AI 总结做对比才知道。

具体怎么评价总结效果,我最看重以下几个点:

  • 内容不能偏离核心主题,不能大量遗漏;
  • 输出的内容结构清晰,配合一些图表最好;
  • 输出的文字可读性强,表述方式别太生硬。

另一方面,从 Prompt 构建的角度去看,步骤可以拆解为:

  1. 将音视频转成文字;
  2. 基于文字内容进行总结;
  3. 按照结构化要求进行输出。

上述的步骤,在执行层面存在两种实现方式:

  • 使用大模型进行总结,总结效果取决于模型能力 + 自己的 Prompt + 自己的知识库 + 平台插件
  • 如果是使用现成的 AI 产品进行总结,那其实是模型能力 + 别人的 Prompt + 现有的微调

思考与疑惑

在折腾的过程中,尤其是使用 AI 总结的过程中,我愈发止不住思考:AI 总结的内容是「准确」的吗?

每个人对内容的价值点判断是不一致的。相同的内容,可能 AI 认为重要、核心的内容,我并不在意。这样,如果我基于 AI 的总结结果去判断是否进行下一步阅读时,反而可能遗漏我认为重要的部分。

「准确」这个问题有点泛,可以进一步拆解为几个问题:

  • 它总结的内容有遗漏或者重复吗?
  • 它总结的内容是否存在偏见与误差?
  • 它总结的内容与原文真正想表达一致吗?

AI 现阶段无法像人类那样,深入理解文本或视频内容的深层含义和上下文联系,它的表现受限于训练的数据源与模型推理能力,从实现原理角度看当做是在玩文字游戏也不为过。

开始怀疑之后,我又产生了几个相关问题:

  • 从价值角度看,AI 总结帮我提高了多少效率?真的提高了吗?
  • 会不会反而让我舍弃了一些自主思考判断的机会?

以及;

  • 我真的能放心把总结的任务交给它吗?

带着这些疑问,我开始慢慢寻找答案。在 Twitter 上看到了不同博主的观点,让我有从另一个视角的启发。原文如下:

憋了很久,但最终还是决定说出来的一个看法:最没有意义的 AI 应用就是那些「总结类产品」。原因:

1. 它不能代替你阅读。总结的意义在于阅读后,而不是阅读前;

2. 在「节省」时间的同时,它也让你离「一手信息源」越远。我们现在接触的很多已经是二手信息,这种没有阅读的「总结」是三手,四手,五手知识;通过「总结」学到的不是知识,是以为自己学到知识的幻觉(或虚荣心)。

3. 总结的本质是对具象知识的吸收和高度抽象。总结的最大获益者是做出总结的人,而不是阅读总结的人。跳过具象知识,就像猪八戒吃人参果:「你不知道有籽没籽儿,有核没核,它到底是个什么味儿啊」-一个 80 后西游记迷控制不住的 reference.

4. 试图通过阅读总结学知识,是很多人「懂得很多道理,却依然过不好这一生」的原因。学知识,获得智慧,没有捷径。

5. 一个更加现实的问题:你无法确定 AI 总结的是准确的。想要确定它是准确的,你需要去读一下。所以,why even bother? (如果是读书,人家已经有了一个准确的 summary: 目录。如果是读论文,人家已经有了摘要。而书籍和论文是最好的信息源。)

6. 这种 AI summary 甚至都不是可靠的内容筛选器。即使它总结的准确,这种高度抽象会导致那些越是正确的内容,被总结出来的越是那些「老生常谈」的大道理。看起来都千篇一律。你会 pass 掉很多好的内容。

——来自 Twitter 「一口新饭」

GPT 类的语言模型本身就是一道有损压缩了,再被良莠不齐的套壳软件继续有损压缩一遍,还能剩下个啥,读这类总结就是看个热闹。所以总结类应用最大的用途就是帮助在视频中定位,比如大约在 7 分钟的时候开始讲什么了。

——来自 Twitter 「Axton」

并不是任何内容都适合 AI 总结,比如闲聊访谈类的播客就不适合,内容太过分散;或者短视频或者 vlog,很多都是只有画面,没有说话内容,这些都没法总结。

这些内容会更加适合 AI 总结:

主题较为明确的播客或视频,如:TED 视频

手机或者数码产品分享视频,如各种评测

新闻或者时事类播客或视频

——来自 Twitter 「JimmyWong」

我的结论

我觉得自己还是需要一款 AI 内容总结工具的,只是需要区分内容去使用:

  1. 主体明确但内容比较长,或者是英文内容,先用 AI 去总结或翻译;
  2. 基于总结的框架,再去判断是否需要进一步精读;
  3. 精读的过程去探索更一手的信息,去主动思考,去记录笔记;
  4. 阅读完成之后,再整体人工总结一遍,吸收消化。

前两步,是让 AI 帮自己筛选过滤内容,然后进入主动阅读环节;后两步对优质内容进行学习思考。切勿太依赖 AI 工具什么都丢给它去阅读总结。记住自己的出发点:在信息洪流中,更好地聚焦与思考。

最后,不得不说,AI 内容总结在当前阶段并不完美,但还是有它的价值,随着 AI 能力的提升,我相信这些问题大部分会得到解决。总有一天 AI 能切实帮到我们,让生活更加方便和智能。

> 关注 少数派小红书,感受精彩数字生活 🍃

> 实用、好用的 正版软件,少数派为你呈现 🚀

© 本文著作权归作者所有,并授权少数派独家使用,未经少数派许可,不得转载使用。


文章来源: https://sspai.com/post/88530
如有侵权请联系:admin#unsafe.sh