据华盛顿邮报发布的消息,为了防止自己平台的内容被其他公司白嫖,知名网络社区 Reddit 计划在后续封杀谷歌和必应等搜索引擎的爬虫,同时为了防止 OPENAI 等获取 Reddit 论坛的内容,Reddit 还计划要求用户必须登录账号才可以浏览内容。
最近一年因为 AI 问题 Reddit 似乎有些魔怔了,例如之前 Reddit 要求 AI 公司必须与该公司签订协议支付费用才能获取数据进行训练。
那么怎么防止这些 AI 公司未经授权抓爬数据呢?Reddit 直接调整了 API 接口,结果这也导致大量第三方 Reddit 客户端凉凉,这引起了巨大争议,但 Reddit 最终也没有松口。
现在封杀搜索引擎对 Reddit 来说其实是个大事件,因为 Reddit 很多流量是靠着搜索引擎导流而来的,如果封杀谷歌和必应等搜索引擎,未来 Reddit 上的新内容将无法在网上搜到,那这肯定会导致流量下跌。
针对华盛顿邮报的报道 Reddit 澄清表示没有任何变动,同时向华盛顿邮报发邮件要求他们进行更正。
随后华盛顿邮报也确实添加了更正信息,不过新增信息只变更了要求用户登录才能阅读帖子的部分,但 Reddit 并未否认可能会封杀谷歌和必应等搜索引擎的传闻。
也有匿名人士告诉华盛顿邮报称,Reddit 高管认为即便封杀搜索引擎,Reddit 也可以继续撑下来。言外之意就是流量肯定会下跌,但 Reddit 也决意这么做。
对 Reddit 来说,可能现在靠着 AI 大潮卖数据才是最好的买卖,所以现在不惜毁掉第三方客户端和封杀搜索引擎,冒着流量大跌的风险也要牢牢守住自己的数据。
PS:我觉得 Reddit 可能已经在某些帖子里埋上特定的标识符,后续等各种 AI 产品更新后可以通过测试标识符来判断这些模型是否使用了 Reddit 的数据,如果被判定使用了数据但不是签订 API 合同的客户,那 Reddit 就可以起诉了。(类似做法在国内已经比较流行,主要就是防止竞争对手抓爬数据的。)
版权声明:感谢您的阅读,除非文中已注明来源网站名称或链接,否则均为蓝点网原创内容。转载时请务必注明:来源于蓝点网、标注作者及本文完整链接,谢谢理解。