首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX 提问指南
广告
V2EX
›
问与答
关于爬虫的一个问题
0x663
·
180 天前
· 505 次点击
这是一个创建于 180 天前的主题,其中的信息可能已经有所发展或是发生改变。
我用的 Java 的 Webmagic 去爬取一个页面,我如果用浏览器直接打开的话这个页面会跳到一个新页面是一个文档请求但是如果我用 webmagic 去获取这个页面的 html 的话发现是通过 window.location.href='./页面 id' 而不会去跳转到这个页面,如果我想获取这个页面,应该怎么去写呢
页面
webmagic
id'
获取
4 条回复
•
2023-03-29 10:11:15 +08:00
1
theOneMe
180 天前
那就用跳转后的那个路径不就行了
2
centralpark
180 天前
建议补充一些前端基础常识再来写爬虫
3
0x663
OP
180 天前
@
theOneMe
这个路径是上个爬虫获取到的列表路径,然后通过这个列表路径再去创建新的爬虫
4
xlh001
179 天前
获取当前网站路径拼接一下啊
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
我们的愿景
·
实用小工具
·
2615 人在线
最高记录 5930
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 29ms ·
UTC 07:52
·
PVG 15:52
·
LAX 00:52
·
JFK 03:52
Developed with
CodeLauncher
♥ Do have faith in what you're doing.