这是一个创建于 2110 天前的主题,其中的信息可能已经有所发展或是发生改变。
一个简单的爬虫,二三十分钟爬一次一个美国网站固定页面的一个数值,无需登录,网站最近才加上的反爬,限制了同一 IP 请求的次数
代码里 header 信息齐全,网站必须美国 IP 请求,所以找了 100 个免费的美国高匿代理,user-agent 也搞了 10 多个,本地跑测试,IP 都可用,程序跑起来一切正常,跑 3 个小时一个 403 没有,但是部署到搬瓦工美国的服务器上,能有三分之一的代理 IP 请求报 403 Forbidden
我把报错的 IP 都存下来,放到本地跑,全部都可用,都能爬到数,然后再弄到服务器上,就是 403,有哪位遇到过这种情况吗,求帮助
python3.6 写的很直白简单的爬虫,搬瓦工洛杉矶的服务器
|
|
1
hidder 2019-02-27 11:37:22 +08:00
在 vps 上试下代理 ip 的连通性
|