macOS 存储管理漫谈:去重是节约空间的最好方法
虽然最近各种用LLM帮忙整理电脑里的文件、删除垃圾数据的帖子很火,但我天然对这种LLM用法抱有一丝警惕,我始终相信电脑里存在的文件都有自己的意义。所以我就想在这篇文章里和大家聊聊ma 2026-6-5 10:0:12 Author: sspai.com(查看原文) 阅读量:5 收藏

虽然最近各种用LLM帮忙整理电脑里的文件、删除垃圾数据的帖子很火,但我天然对这种LLM用法抱有一丝警惕,我始终相信电脑里存在的文件都有自己的意义。所以我就想在这篇文章里和大家聊聊macOS里的存储管理 ...

虽然最近各种用 LLM 帮忙整理电脑里的文件、删除垃圾数据的帖子很火,但我天然对这种 LLM 用法抱有一丝警惕,我始终相信电脑里存在的文件都有自己的意义。

所以我就想在这篇文章里和大家聊聊 macOS 里的存储管理。

手动清理「垃圾」到底有多必要

在前 LLM 时代,macOS 上就有很多的清理软件,但真的有手动清理垃圾的意义吗?但要我说,有很多情况单纯是因为展示出来的数据比较唬人罢了。

下面我们不妨一起先看看 macOS 中常见的、会被清理软件标记为垃圾的文件夹目录:

首先 *unix 系统经典的临时目录 /tmp,很多命令行工具、脚本、编译器、安装器、压缩工具、下载工具会把临时文件放在这里。这个目录 macOS 会通过脚本自动检查,大约每 3 天清理一次,重启电脑时也会自动清理。

其次就是颇具 macOS 特色的 /private/var/folders/,这个是现代 macOS 的运行时目录,很多软件、系统 API 在调用时生成的缓存、编译中间产物、未保存的草稿、应用间通信的临时文件等等数据,都会放到这个目录下。所以这个目录也不能直接清理,需要仔细分辨。好在 macOS 会在启动、注销、周期性维护时清理这个文件里的数据,所以我们大多数时候都不需要清理这个目录。

最后就是,大多数「清理软件」最爱清理的~/Library/Caches/了,看起来这个目录随随便便就占了很大的空间,但缓存存在的意义就是用空间换时间,比如 Chrome 浏览器的缓存,就可以很大程度上加快部分网页的加载速度。又比如 HomeBrew 的元数据索引文件 formula.jws.json 也是存放在这个目录里的,如果删除的话,下次 brew 查询软件信息又需要重新下载1

所以清理垃圾数据本来就是个半个伪命题,现代操作系统2一般都能很好得管理系统中的各种临时目录。

而我之所以说是半个伪命题,主要就是确实是有一定种类的「垃圾」需要清理——卸载残留。在 macOS 中,把软件从 /Applications 拖到废纸篓这个过程,通常只删除了应用本身。软件的配置、缓存、日志、后台组件、登录项、扩展还会留在系统的:

~/Library/Application Support/
~/Library/Caches/
~/Library/Preferences/
~/Library/Saved Application State/
~/Library/Logs/
~/Library/ContLLMners/
~/Library/Group ContLLMners/
~/Library/LaunchAgents/
/Library/LaunchAgents/
/Library/Application Support/
/Library/Preferences/
/Library/Logs/

这种情况下,清理软件就能通过整合展示与软件相关的目录,方便你在卸载时顺手把这个软件相关的文件夹一起删掉。

LLM 清理垃圾的其他问题

用 LLM 清理垃圾,除了「文件本身是否有意义」这个问题之外,还有一个绕不开的问题:LLM 的机制不能正确判断文件是不是垃圾。

LLM 识别垃圾文件,主要依赖的是文件的表面特征:文件名、路径、大小、修改时间。它只能根据前面获取到的信息,用「拼字」的方法,生成一个看起来合理的解释,实际上它不能证明这个文件是真的没有用。

不管怎么样 LLM 就是不知道为什么可以清理

比如,LLM 虽然说 Adobe Camera Raw 预览和处理缓存是被可以清理的垃圾,但没告诉你清理了以后下次再打开 Lightroom,又要重新生成一次,不然浏览、编辑照片时的响应速度就会很慢。这也是比较经典的缓存用法——用空间换速度。又比如,一个三年没有修改过、体积很小、文件名不在 LLM 训练数据里的文件,LLM 就会认为它是个没什么用的垃圾;但它可能是某个软件的授权文件、或是某个脚本所依赖的配置文件。LLM 删除以后反而会影响正常使用。

对于写作、总结、分类的场景来说,「拼字」大概率就能生成出一个还算能读的东西,感觉不行还能重新生成一次。但清理电脑垃圾不同,哪怕只有极小的概率删错,后果也是不可接受的。

如果想在终端里把一个文件放到回收站里需要借助 Apple Script

此外,文件删除命令 rm 还特别有风险,不小心多个空格,整个硬盘里的数据都会消失。rm 删除的数据也不会进回收站,真的误删除后,想找回来要不靠备份、要不就得上数据恢复工具。这就显得 LLM 清理垃圾得不偿失了起来。

最后的最后,就是隐私问题。扫描电脑里的文件,就意味着 LLM 可能接触到文档、聊天记录、照片、信用卡、账单下载记录等高度个人化的数据。哪怕模型和供应商本身没有什么恶意,但依然存在着隐私泄漏的风险。

我节约 Mac 存储空间的思路


文章来源: https://sspai.com/prime/story/macos-storage-management-deduplication
如有侵权请联系:admin#unsafe.sh