V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
nong99
V2EX  ›  问与答

怎么定义爬虫?很多第三方 APP 爬取论坛内容,那不也是爬虫了吗?

  •  
  •   nong99 · 1 天前 · 564 次点击

    如题,类似的比如:论坛助手
    我理解就是爬取论坛内容了,而且有的论坛应该没有暴露提供 API 调取数据的。

    那么此间行为不就是属于爬虫了吗?
    这个爬虫的行为怎么定义呢?

    7 条回复    2024-12-27 17:13:25 +08:00
    iyaozhen
        1
    iyaozhen  
       1 天前
    不好定义,别人告你 也要打过官司才知道

    简单来说除非给钱特别多,不然不做。zf 类的坚决不做,因为没机会讨论定义
    nong99
        2
    nong99  
    OP
       1 天前 via iPhone
    @iyaozhen #1 哈哈,zf 类肯定不搞哈。 明白了
    mumbler
        3
    mumbler  
       1 天前
    符合 robots 协议就没问题
    jifengg
        4
    jifengg  
       1 天前
    我觉得楼主要的不是爬虫的定义,是“非法爬虫”的定义?
    nong99
        5
    nong99  
    OP
       1 天前 via iPhone
    @jifengg #4 Yes ,应该就是这个意思了。
    @mumbler #3 好的👌我去了解下🫡
    Hookery
        6
    Hookery  
       16 小时 37 分钟前
    论坛助手本来就是爬虫,搜索引擎也是爬虫。
    lisxour
        7
    lisxour  
       9 小时 57 分钟前
    爬虫不是贬义词,使用程序化、自动化等方式采集都可以叫爬虫,这本来就很泛的。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1061 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 200ms · UTC 19:10 · PVG 03:10 · LAX 11:10 · JFK 14:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.