V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  coderhxl  ›  全部回复第 1 页 / 共 4 页
回复总数  73
1  2  3  4  
11 天前
回复了 magic3584 创建的主题 互联网 准备换邮箱了
outlook 还不错
13 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@charslee013 很 OK
13 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@hpan 可以调用 crawlFile API 爬文件,https://coder-hxl.github.io/x-crawl/cn/guide/crawl-file
个人不应该将公司的未发布代码作为个人开源项目使用
想开发漂亮的网站应该考虑 UI 框架吧
@ttentau1 厉害啊,有机会也可以试试 x-crawl 获取数据,https://github.com/coder-hxl/x-crawl
得先打好基础,html css js 得牢固,不然在学 Vue 过程中还要去补基础,这样效率很低的
16 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@MapleEve OK ,Dify 还没了解过,有机会可以瞧瞧,搞开源还是蛮消耗精力的
16 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@gongquanlin 基本的设备指纹也够用
16 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@teenthsch gpt4 跟 gpt3 对比还是很听话的
16 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@changz 现在用 AI 成本高但以后不一定
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@charslee013 这个得试了才能知道,如果有好的建议也会采纳的
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@jianyang 并且这种方式貌似不适用于通用型爬虫,适用于特定网站。
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@jianyang AI 主要是能够更好地应对网站更新后类名或结构改变的问题,并且 AI 还能根据要求筛选数据等操作。
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@topang 可以自己封装一个方法,需要的时候调用就行了
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@tinyzilan123 就看使用者怎么用了
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@tinyzilan123 对的,所以有另一种解决方案,二者结合,第一次爬取的时候缓存路径,后面让传统爬虫用缓存路径的,如果错误就调用 AI 重新获取路径再缓存。这样既不用担心网站更新导致爬虫工作失败,也避免浪费 token
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@bubble21 当时我也考虑到加上这个,用 puppeteer 获取页面截图,上传截图给 AI 提取内容。
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@bubble21 这是个很不错的点子,现在暂不支持,后续会考虑加上哦
17 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@CAze 原理差不多是这样,但是如果仅仅是告诉 AI 要拿哪些数据,效果可能还不是很好
1  2  3  4  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1058 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 22:39 · PVG 06:39 · LAX 15:39 · JFK 18:39
Developed with CodeLauncher
♥ Do have faith in what you're doing.