X/Twitter更新使用协议施加限制:未经书面同意禁止抓取平台任何内容
2023-9-12 00:18:43 Author: www.landiannews.com(查看原文) 阅读量:30 收藏

在埃隆马斯克带领下,目前 X 正在继续施加更多限制,任何未经 X 书面同意的情况下,出于任何目的、以任何形式、抓取 X 平台任何内容均属于违反 X 的使用协议,有这条协议打底后,马斯克就可以起诉他发现的任何爬虫。

此前 X 已经在美国起诉四个 IP 所有者非法抓取 X 平台的内容,尽管目前还不知道有没有查到这些 IP 的所有者,不过马斯克显然是在杀鸡儆猴。

在马斯克接管 X 后,X 对平台内容的获取限制日趋严厉,例如此前 X 就变更开发者政策,删除免费 API 接口,如果要想抓取 X 内容那开通 API 费用会非常高。

同时 X 还对免费用户每天可以看的推文数量进行限制,这既是用来防范某些开发者不通过申请付费 API 而是注册一大批账号进行抓取,也是为了刺激更多 X 用户开通 X Premium 订阅会员。

而未登录情况下只能浏览推特算法推荐内容,无法查看用户主页浏览全部推文 (一开始的限制是未登录禁止浏览任何推文,后面改成可以通过具体推文链接访问单条推文)。

X/Twitter更新使用协议施加限制:未经书面同意禁止抓取平台任何内容

新的抓取限制条款:

X 此前已经更新 robots.txt 文件,阻止除谷歌爬虫 (GoogleBot) 以外的一切爬虫,包括诸如 Bing、Yandex 等搜索引擎爬虫。

但 robots.txt 毕竟只是行业约定俗称的爬取规范,并非法律协议,所以现在 X 删除关于 robots.txt 进行合法抓取的描述,取而代之的就是未经书面同意任何抓取都是违规行为。

此前条款中是这么要求的:注意:如果按照 robots.txt 文件的规定进行抓取服务时允许的。但是,未经我们实现同意就抓取是明确禁止的。

而在 2023 年 9 月 29 日生效的新条款中删除了关于 robots.txt 的描述,取而代之的时:注意:未经我们事先书面同意,明确禁止出于任何目的的以任何形式的抓取或抓取服务。

是否与谷歌续签协议还是未知数:

尽管此前 X 修改限制时也误伤谷歌,导致谷歌搜索无法抓取 X 平台内容,但很快 X 就修复了这个问题,毕竟 Twitter 在 2015 年与谷歌达成过协议,允许谷歌抓取 Twitter 平台的内容。

不过这其实是一个 BUG,因为其他爬虫还可以爬谷歌来获取 X 平台的内容,所以很难说后面 X 是否也会限制谷歌抓取。

如果协议即将到期马斯克大概率是不会续签的,可能当前继续保留谷歌抓取也只是碍于协议,不能限制谷歌抓取。

版权声明:感谢您的阅读,除非文中已注明来源网站名称或链接,否则均为蓝点网原创内容。转载时请务必注明:来源于蓝点网、标注作者及本文完整链接,谢谢理解。


文章来源: https://www.landiannews.com/archives/100200.html
如有侵权请联系:admin#unsafe.sh