V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  aa233322aaa  ›  全部回复第 1 页 / 共 1 页
回复总数  3
2015-04-09 16:59:13 +08:00
回复了 aa233322aaa 创建的主题 Java 关于网络爬虫 中遇到的一些问题
@anexplore 谢谢,我再去试试
2015-04-09 09:47:56 +08:00
回复了 aa233322aaa 创建的主题 Java 关于网络爬虫 中遇到的一些问题
@anexplore 谢谢你的解答,我还有些疑问。。。我要怎么知道这个站点的其他IP?通过浏览器访问看连接详情吗?还有假设我4S一次访问的频率 ,那一天也有2W次的量,这种数量一般不会是人为点击的吧。。那些反爬虫严格一点的网站不会封吗?如果加大访问间隔 是不是需要用多台服务器 开多线程来保证量?
2015-04-08 16:37:26 +08:00
回复了 aa233322aaa 创建的主题 Java 关于网络爬虫 中遇到的一些问题
@anexplore 我还有点疑问,1.代理IP的的有效时间,一般代理IP的有效时间不是很短吗?2.同一个IP爬取一个站点,在一定时间内要是数量过多的话 不是会被封吗?
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3216 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 618ms · UTC 11:59 · PVG 19:59 · LAX 04:59 · JFK 07:59
Developed with CodeLauncher
♥ Do have faith in what you're doing.