举个栗子
淘宝商品列表页面,获取名称和图片,以及每个商品详情后的其他一些信息。
想问下爬虫框架和 Selenium 哪个更合适,不容易触发风控。
另外想根据名称描述和图片自动分类,有没有开源或者免费的
基于开源的 tensorflow 自己训练 AI 的话耗费太大 感觉小题大做了。
1
incubus 2023-12-03 13:21:36 +08:00
这也想白嫖?
|
3
r6cb 2023-12-03 17:09:30 +08:00
还是早点放弃吧,正常用户去浏览都经常要人机认证。
|
5
aureole999 2023-12-04 13:47:45 +08:00 1
看你要访问的是什么网站了。有的不怎么管的你用什么都行。
不容易触发的应该还是 Selenium 或者 Puppeteer 加 Stealth 插件。 第二个 chatgpt api 之类的也许能做到? |