1
ericls 2015-06-20 16:41:56 +08:00
既然都用了 Python3 了
如果真的是「爬虫」,也应该用aiohttp之类的异步吧 |
2
n37r06u3 2015-06-20 18:05:43 +08:00
都是漫黄站啊
|
3
binux 2015-06-20 18:27:27 +08:00
人家明明有 API,你非得解析页面
http://konachan.com/post.json |
11
wudaown OP @binux http://konachan.com/post.json?page=2&tags=yuuki_asuna 是第二页的json
http://konachan.com/post.json?page=1&tags=yuuki_asuna 是第一页的json ... 分析完一页不是要分析第二页么.. |
19
KyoHiroki 2015-06-21 01:26:46 +08:00
1.html页面如果有用js生成的动态内容,你是爬不到的,json没有这个问题;
2.渲染html页面对服务器的负担比json大; 3.html页面可能会经常修改,不易维护。 |