用爬虫抓取数据，这样的行为是否合法

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 3600 天前的主题，其中的信息可能已经有所发展或是发生改变。

有个问题，求教一下给位，望知情的人告知下,用爬虫抓取数据，这样的行为有没有违法，如果算，相关的条例出处望告知下，谢谢啊！

给位

告知

求教

行为

32 条回复 • 2018-02-07 11:04:39 +08:00

dphdjy

2016 年 4 月 5 日 via Android

互联网公开资源爬取并不违法，不过要看具体怎么说，每个站都不一样，但是不对对方造成巨大影响一般没事

但是需要尊重 Robots 协议，这是协议不是命令，不过不接受容易被 ban

zhjits

2016 年 4 月 5 日 via iPhone

看站点 TOS

pimin

2016 年 4 月 5 日 via Android

我觉得爬虫抓到的都是对方允许访问的公开数据，抓数据并不违法
通常争论比较大的应该是怎么处理数据
比如抄别人文章发布到自己网站上

wy315700

2016 年 4 月 5 日

之前有人爬 facebook ，然后被抓了，坐牢的

Shura

2016 年 4 月 5 日 via Android

@wy315700 请给出正确的新闻来源？

fway

2016 年 4 月 5 日

百毒,360 属于法外之地

nina2000

2016 年 4 月 5 日

@zhjits TOS 是什么能提供个链接么？

freewarcraft

2016 年 4 月 5 日

@nina2000 Term Of Serivce 用户协议

imn1

2016 年 4 月 5 日

1.前提是网站的使用协议
2.低频没给人家网站造成问题
3.再利用的方式见 1 ，一般自己阅读用都是允许的，二次发布就难说了

paulagent

2016 年 4 月 5 日

@nina2000 服务协议，每个网站都有，你抓之前去网站看一眼。

dallaslu

2016 年 4 月 5 日

@nina2000 Terms of service

nina2000

2016 年 4 月 5 日

@freewarcraft 好的了解了

lecher

2016 年 4 月 5 日 via Android

法律上的规定是，抓取公共展示的信息不违法，允许抓取网站内容，对公众展示内容必须提供来源及源站地址，若有版权纠纷，必须配合版权方进行内容下架，否则可以到工信部投诉举报侵权网站，投诉多了有取消域名备案的风险。
涉及版权的经济损失，可以提起诉讼申请经济赔偿。

nina2000

2016 年 4 月 5 日

@lecher 能提供下出处么先前对这块没有重视想学习一下相关的知识

liamxd

2016 年 4 月 5 日

互相抄已经是趋势。你的东西被人抄，你也同时抄别人的东西。

有的人抄了，就没事。有的人抄了就有事。看别人想不想搞你。

保持自己不吃亏吧。

root787

2016 年 4 月 5 日

关注。

lecher

2016 年 4 月 5 日 via Android

做信息聚合的都可以看看这个条例：避风港原则。
目前来说，做搜索引擎的都在往这上面靠就是抓取、索引、展示部分信息，只要不是全文展示并及时配合版权方将无版权内容下架，可以获得避风港原则的豁免权，不用承担法律责任。

最新出的互联网版权管理条例对信息展示增加了版权限制，未获得版权的内容，禁止对公众发布。

按这两个条例而言，抓取是无罪的，国家更看重的是展示这方面的管理。

nina2000

2016 年 4 月 5 日

@lecher 好的了解了去学习一下谢谢！