都说 python 最擅长爬虫
但实际上我以前没啥需求, 没怎么实践过
请推荐下实际生产项目中好用的爬虫框架或方案
1
xiaoriri666 1 天前
用 Scrapy 爬虫主要还是加解密其实跟语言的关系不大
|
2
xiebow 1 天前
scrapy +1
|
3
ospider 1 天前
爬虫不需要框架,选个 http 请求库可能更重要,比如 curl-cffi
|
4
Emma24 1 天前
入门:爬过时的数据
进阶:爬已有的数据 天堂:爬实时的数据 地狱:爬没有的数据 |
5
nyxsonsleep 1 天前
已经有人说 scrapy 了,那我加一个 playwright
|
6
chenqh 1 天前
直接硬爬?
|
7
iorilu OP |
8
luzihang 1 天前
自己写脚本-->使用 feapder scrapy ……-->遇到问题具体问题,自己写脚本框架,scrapy 也用,主要看解决什么问题和开发速度而定
|
9
Cy86 1 天前
我觉得 requests 应该够了吧, 直接把接口抓出来比较简单,我最近也在鼓捣爬虫练手, 你这是要爬啥网站呢
|
10
randy552162 1 天前
@iorilu 你说的这些好像都跟框架没啥关系,哪个框架都要你自己处理一下这些问题
|
11
yinft 1 天前 1
其实没必要非纠结库,整个过程无非就是 构建请求-->解析数据-->存储存储。基于 aiohttp 随便玩
|
12
iorilu OP @randy552162 有框架能处理部分这种问题的 , 当然了, 具体还要看怎么实践, 爬虫这东西其实细节很多, 爬 10 条数据和爬 1 万条完全两回事的
|
13
llsquaer 1 天前
按照你这个要求其实不用框架,用框架反而增加负担,直接 requests 手撸开始。写多了,慢慢的你就写成自己的框架了。
|
14
adaonline 1 天前
自己手撸起来就行了
|
15
brianXGOGO 22 小时 45 分钟前
DrissionPage 好用
|
16
fanjk 19 小时 58 分钟前
我基本都是 requests 直接搞,不同的项目只需要替换对应的数据处理模块就行
|