V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
maxmin
V2EX  ›  问与答

关于抓煎蛋网的妹子图

  •  
  •   maxmin · 2017-12-19 17:21:48 +08:00 · 9098 次点击
    这是一个创建于 2513 天前的主题,其中的信息可能已经有所发展或是发生改变。

    问下各位大大,现在煎蛋网貌似都进行加密处理了。

    抓下来的一个图片 ID,一个 blank.gif 的下载 url,还有一个 hash 值。

    这三个值如何解码出来正常显示图片呢?

    抓到的个人认为的要素如下: 3648355 https://img.jandan.net/img/blank.gif" 01aexN/JQkzwK5MKgiyoaue8DQ9zMRZr4rz1KeCOQVq1EekJSnMbfNfGlKbm2CVqXaqpImm8PAuZ29rChMe2nUbuwx0Pv2UCiDll8p9rtOZwTd2O6IpXbw

    3648352 https://img.jandan.net/img/blank.gif" a4f5BIbDxuQq88bWJ+CVqW/cfY55/DidJsXn4+37ojvaAHzLf123VMLuIQuCM5ozRhAWmegBHNrnIjiem9Q0IzQAKHEz/RMkbCjaqZkdhqyxGHifpp0Kpg

    3648284 https://img.jandan.net/img/blank.gif" 44cecM9LLAGYeTYiqI9VDlkemzZBt+vsPtLkDrWtvrl8Oudu15MStxxbMH9Zf9kRce4Jwd8oeeoWp1wMMh1LDrJlifMf6rDbvYsbSGKA5JxXVUpUIo09dw

    3648265 https://img.jandan.net/img/blank.gif" 1ce8Fy73YNsQZRmpVYoAILPEUA3C/xKbMwxyB2uFGmGL/hITirtXNk+t12XZbiYeZdOj477fTB6CjcMcSuzfNaDUsDvquQJ2kYYl/hptSsoTMbklaZwkHg

    3648255 https://img.jandan.net/img/blank.gif" f9c3olrMbfJo4mQ1g9SVblXOg9HCSEXNKvbdVeXZu7ZnxCbqZgSqcfzQ6Ro1zoVk6m2MTIIZ9oJ2s0nhU4rspURiRrLOZuB4koOjhOOBz81lR5u3zZD8AA

    3648249 https://img.jandan.net/img/blank.gif" 978eHutjCethv14sXsm0c8+sLVWhFkDMOdmEs4MlLFZvyQyO0eU/jkqVRK7QU7C6qy5YZwptyEKAA9SOXQMLhz/SgT30/MaMoz3wiBeRYOoRFcM6ejLwgw

    28 条回复    2017-12-21 04:18:15 +08:00
    SourceMan
        1
    SourceMan  
       2017-12-19 17:22:40 +08:00
    煎蛋又要被爬挂了吗?
    chen2016
        2
    chen2016  
       2017-12-19 17:23:07 +08:00 via Android
    估计要被煎蛋粉喷
    mohoumk2
        3
    mohoumk2  
       2017-12-19 17:24:25 +08:00 via Android
    已拉黑楼主
    wekw
        4
    wekw  
       2017-12-19 17:28:21 +08:00
    @chen2016 我们叫“蛋友”
    maxmin
        5
    maxmin  
    OP
       2017-12-19 17:40:11 +08:00
    @mohoumk2 就抓一下而已,怎么就委屈的拉黑了呢。
    maxmin
        6
    maxmin  
    OP
       2017-12-19 17:41:12 +08:00
    @SourceMan 抓某一个页面的几个数据,不会这么容易挂的,只是测试而已。

    现在抓下来的数据都是加密的,不知道怎么解密
    onsale
        7
    onsale  
       2017-12-19 17:47:50 +08:00 via Android
    换个 bat 的网站爬一爬
    airycanon
        8
    airycanon  
       2017-12-19 17:49:48 +08:00
    @maxmin 既然是测试,不需要解密吧?
    lingo
        9
    lingo  
       2017-12-19 18:00:33 +08:00
    心疼煎蛋。。。
    lalalakakaka
        10
    lalalakakaka  
       2017-12-19 18:07:52 +08:00
    煎蛋人家都发文求你们了,承认自己小破站,没钱买流量,也没有足够的技术能力和人力跟你们玩猫捉老鼠似的反爬虫。。。

    你知道你的这种行为给别人带来多少麻烦么
    013231
        11
    013231  
       2017-12-19 19:07:08 +08:00   ❤️ 1
    @lalalakakaka
    User-agent: *

    Disallow: /wp-admin/
    Disallow: /wp-content/
    Disallow: /wp-includes/
    Disallow: /trackback/
    Disallow: /xmlrpc.php
    Disallow: /category/
    Disallow: /author/
    Disallow: /feed/
    Disallow: /search/
    Disallow: /*?*

    Crawl-delay: 5
    Request-rate: 30/1m

    Sitemap: https://jandan.net/sitemap-index.xml

    User-agent: ia_archiver
    Disallow:

    User-agent: Mediapartners-Google
    Disallow:

    User-agent: Baiduspider
    Disallow:

    User-agent: YisouSpider
    Disallow: /

    User-agent: grapeshot
    Disallow: /

    User-agent: dotbot
    Disallow: /

    user-agent: AhrefsBot
    disallow: /

    User-agent: Exabot
    Disallow: /

    哪有声明不让爬妹子图?
    3dwelcome
        12
    3dwelcome  
       2017-12-19 20:43:27 +08:00 via iPhone
    @013231 管理员贴过爬虫流量图、表示流量太大、小网站耗不起。
    xmi
        13
    xmi  
       2017-12-19 22:44:39 +08:00
    还有人在爬..
    mengli
        14
    mengli  
       2017-12-19 22:51:30 +08:00
    以煎蛋无聊图为内容源的网站可不少,去爬他们把。
    onsale
        15
    onsale  
       2017-12-19 22:58:23 +08:00
    @013231 #11
    gyteng
        16
    gyteng  
       2017-12-19 23:41:33 +08:00
    为何大家都喜欢爬煎蛋,有没有其他类似煎蛋妹子图的网站可以爬呢?
    cxd44
        17
    cxd44  
       2017-12-20 00:03:01 +08:00 via Android
    @3dwelcome 耗不起就不要玩,关机啦
    jininij
        18
    jininij  
       2017-12-20 00:06:53 +08:00 via iPhone
    没用过煎蛋,记忆里煎蛋的图用的不是新浪的图床么。游客请求的页面,本体都该走的 cache。不是很能理解,一个人的爬虫能有多大的并发,能把网站弄垮。
    zhaojjxvi
        19
    zhaojjxvi  
       2017-12-20 00:07:46 +08:00 via iPhone
    豆瓣有个请不要害羞的小组,去爬那个吧,一般夜间有福利
    greatbody
        20
    greatbody  
       2017-12-20 00:10:22 +08:00
    @zhaojjxvi GitHub 上面有通用的美女图爬虫脚本,nodejs 写的通俗易懂好变更。
    xmcp
        21
    xmcp  
       2017-12-20 00:23:12 +08:00

    解密算法是 https://paste.ubuntu.com/26215944/
    看起来比较复杂,不过如果真想爬的话直接把代码丢到 NodeJS 里跑就行了。
    redmoonly
        22
    redmoonly  
       2017-12-20 08:03:34 +08:00 via Android
    @cxd44 为什么总有人这么没素质还理直气壮,人家办网站花你一分钱了么,爬虫爬的流量不是钱?总是搞得大家都没得玩了就开心了?🙃
    maxmin
        23
    maxmin  
    OP
       2017-12-20 08:51:18 +08:00   ❤️ 2
    感谢各位的告知,决定不动煎蛋网~~
    也就是写一个玩玩,想后台加载加载进来,免去每次都要手动点击。

    学习了过程就是很重要的,至于结果或许真的不重要。
    jy02534655
        24
    jy02534655  
       2017-12-20 10:11:00 +08:00
    别玩煎蛋啦,蛋友都看不了图了,煎蛋真的又小又破的...
    coderluan
        25
    coderluan  
       2017-12-20 11:13:26 +08:00
    @mohoumk2 楼主只是不了解情况,了解之后已经做出了正确的行为#23,用信息差 block 别人并不好。

    @cxd44 希望你是说反话,“路上遇见流氓怎么办?耗不起就不要玩,自杀啦”。

    @maxmin 不想加载可以试试写个油猴脚本,下滑自动加载之类的。
    cxd44
        26
    cxd44  
       2017-12-20 19:16:47 +08:00 via Android
    @redmoonly 真的,没钱不要开网站,这么烧钱的流量,何不省点钱。
    cxd44
        27
    cxd44  
       2017-12-20 19:19:20 +08:00 via Android
    @coderluan 我也是为了站长好啊,玩不起就不要玩了,免得伤心啊。天天求爹求娘不要爬站了。
    NoahNye
        28
    NoahNye  
       2017-12-21 04:18:15 +08:00
    折腾了一个小时,终于受不了用关键字 img.jandan.net/img/blank.gif 百度,看到就 V2 一条结果,欣喜点进来......还是照 V 友说的去 qingbuyaohaixiu.com (请不要害羞)吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3489 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 00:44 · PVG 08:44 · LAX 16:44 · JFK 19:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.