V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
yrhtiger
V2EX  ›  Python

爬虫外包有人接么

  •  
  •   yrhtiger · 2022-06-06 16:02:00 +08:00 · 4566 次点击
    这是一个创建于 933 天前的主题,其中的信息可能已经有所发展或是发生改变。

    国外一些航司的数据

    19 条回复    2022-06-08 15:46:04 +08:00
    winnerczwx
        1
    winnerczwx  
       2022-06-06 16:46:29 +08:00
    base64: Y3oxNTk0MjAxMTM=
    LeeReamond
        2
    LeeReamond  
       2022-06-06 16:48:49 +08:00
    这两天怎么感觉看见几个外包爬虫的帖子了。。。爬虫爬的好,__________
    futork
        3
    futork  
       2022-06-06 16:52:33 +08:00
    base64: aGljemxm
    nyfwan123
        4
    nyfwan123  
       2022-06-06 16:53:08 +08:00
    当心钓鱼
    Moker
        5
    Moker  
       2022-06-06 17:03:46 +08:00
    航空的数据 不是有专门的接口
    nmap
        6
    nmap  
       2022-06-06 18:21:23 +08:00
    我看刑😬
    xieqiqiang00
        7
    xieqiqiang00  
       2022-06-06 18:47:13 +08:00
    神咒信,我看刑
    wloverine
        8
    wloverine  
       2022-06-06 18:58:46 +08:00
    我看刑
    wonderfulcxm
        9
    wonderfulcxm  
       2022-06-06 19:06:23 +08:00 via iPhone
    我觉得不刑,还能跨国追捕?惊动国际刑警?
    DoveAz
        10
    DoveAz  
       2022-06-06 19:16:55 +08:00 via Android   ❤️ 2
    怕啥,就算跨国抓捕,被抓过去不就等于润了,好事儿
    LeegoYih
        11
    LeegoYih  
       2022-06-06 21:28:11 +08:00
    不敢
    jamesfuxk
        12
    jamesfuxk  
       2022-06-07 10:35:20 +08:00
    @DoveAz 这个逻辑要是正确就好了
    kaiger
        13
    kaiger  
       2022-06-07 11:53:24 +08:00
    爬虫不搞垮对方的服务器,不会去告你吧
    Chancel
        14
    Chancel  
       2022-06-07 13:37:38 +08:00
    @kaiger 开玩笑,信息安全法里面只要是爬虫大部分都装得进去
    chengxiao
        15
    chengxiao  
       2022-06-07 14:28:17 +08:00   ❤️ 1
    天天一见爬虫,就爬虫搞的好,XXXXX 的 觉得自己很幽默,每个爬虫贴都发一下,像一个傻逼

    你不搞有别的人搞,这东西,你说 gooogle 算不算爬虫?百度算不算爬虫?合理合规的使用爬虫技术有什么问题么?

    张口闭口刑法 进去的,搞得跟自己是个法律专家一样,实际还不是个法盲
    chenxiansheng
        16
    chenxiansheng  
       2022-06-07 16:32:04 +08:00
    专业爬虫:Y2gxMTQyODUyNDk5
    hidder
        17
    hidder  
       2022-06-08 09:24:18 +08:00
    @chengxiao 骂得好,哈哈哈
    fbichijing
        18
    fbichijing  
       2022-06-08 15:44:38 +08:00
    @chengxiao |合理合规的使用爬虫技术有什么问题么? 怕是连你自己也不信。你自己写爬虫的时候可看过 robots.txt ?搜索引擎在这里不好做为对比吧。robots.txt 里面,搜索引擎多数(基本上都是)不受限的。如果要遵守君子协议的话,多少网站自己写的爬虫将寸步难行。也因为 robots.txt 是君子协议,写爬虫者可不遵守,才有那么多参数加密的东西出现。硬要提升到法律层面的话,自己写的爬虫强过 robots.txt 就说不过去了。
    gumupaier
        19
    gumupaier  
       2022-06-08 15:46:04 +08:00
    dHJhdmVsMDAyNg==
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3569 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 04:39 · PVG 12:39 · LAX 20:39 · JFK 23:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.