V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
lc4t
V2EX  ›  分享创造

想把百度贴吧的记录删掉,写了个脚本

  •  
  •   lc4t · 2016-12-10 11:44:17 +08:00 · 4634 次点击
    这是一个创建于 2941 天前的主题,其中的信息可能已经有所发展或是发生改变。

    昨晚上想删 tieba 记录。。以免被爬(hei)被(li)社(shi)。。。

    https://github.com/lc4t/clean-baidutieba

    又一个 err_code 据说是 tbs 不对。。也不造为什么。。

    挂在 vps 上跑啊跑。。

    第 1 条附言  ·  2016-12-10 20:01:37 +08:00
    加了个根据正则删 reply 的参数。。
    19 条回复    2016-12-23 21:07:51 +08:00
    shana
        1
    shana  
       2016-12-10 12:00:00 +08:00 via Android
    贴吧有两种 tbs ,不知道你获取对没有
    lc4t
        2
    lc4t  
    OP
       2016-12-10 12:13:37 +08:00 via iPhone
    @shana 我直接 re 了下.. 你说的两种指的是..?
    shana
        3
    shana  
       2016-12-10 13:00:59 +08:00
    @lc4t 一种是 26 位的,一种是 16 位的。
    26 位的可以在这网址获取 tieba.baidu.com/dc/common/tbs , 16 位的我忘了...
    lc4t
        4
    lc4t  
    OP
       2016-12-10 13:23:45 +08:00 via iPhone
    @shana 16 位就是我 re 匹配的.. 谢啦
    lc4t
        5
    lc4t  
    OP
       2016-12-10 15:24:33 +08:00
    @lc4t 纠正。。 re 页面源码找到的是 26 位的,偶尔出现 tbs 错误偶尔没有。。
    minamike
        6
    minamike  
       2016-12-10 16:24:55 +08:00
    之前我也辛苦地天天删 30 条黑历史 结果有一天由于我回复了一条帖子然而被度婊吞掉 于是我不停回复不停被吞 最终账号被永封了 所有黑历史都不见了 😂
    lc4t
        7
    lc4t  
    OP
       2016-12-10 18:58:52 +08:00 via iPhone
    @minamike 😄真是一个好策略😂😂😂
    Tyler1989
        8
    Tyler1989  
       2016-12-10 19:18:21 +08:00 via Android
    能删指定内容吗例如邮箱
    lc4t
        9
    lc4t  
    OP
       2016-12-10 19:28:49 +08:00 via iPhone
    @Tyler1989 暂时没这个功能.. 你可以在 reply_content 设置个 filter ,根据 filter 加入待删除 list )
    lc4t
        10
    lc4t  
    OP
       2016-12-10 19:58:46 +08:00
    @Tyler1989 好了我加了个参数。。可以给个正则去删
    huang5587783
        11
    huang5587783  
       2016-12-11 12:35:56 +08:00 via iPhone
    好东西啊
    cio
        12
    cio  
       2016-12-12 15:57:31 +08:00
    挺好玩的。看了下源码,爬完了发帖 url 和回帖 url 放入列表 。然后删除的时候 往 哪个地址提交的呢。是提交的 post 吗。然后这些地址是你抓包抓的还是怎么或得到的呢= =就是你怎么知道是这个地址执行删除操作..
    lc4t
        13
    lc4t  
    OP
       2016-12-12 16:27:22 +08:00 via iPhone
    @cio del_reply del_tie 是删除函数. 具体 API 抓包就可以看到.
    XYxe
        14
    XYxe  
       2016-12-15 22:09:55 +08:00
    230308 的问题能解决吗?我这边所有的都提示这个错啊
    lc4t
        15
    lc4t  
    OP
       2016-12-15 23:01:56 +08:00
    @XYxe 我这里有一堆是这个问题。。后来把脚本运行间隔改成 4 小时了。。目前还不造这个问题怎么解决
    XYxe
        16
    XYxe  
       2016-12-15 23:05:56 +08:00
    @lc4t 是不是可以考虑对 APP 抓包啊?
    lc4t
        17
    lc4t  
    OP
       2016-12-16 03:23:27 +08:00
    @XYxe 嗯。。懒。。 有空我试下 app 和手机版吧。。 理论上写爬虫应该从简单的 API 下手的。。 hhh
    Sanko
        18
    Sanko  
       2016-12-23 20:01:37 +08:00
    @lc4t 能详细讲下吗 我现在也出现 230308 错误 纠结一下午了
    lc4t
        19
    lc4t  
    OP
       2016-12-23 21:07:51 +08:00
    @Sanko 230308 还没完全解决。。建议换个手机版 API 试试?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1136 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 17:58 · PVG 01:58 · LAX 09:58 · JFK 12:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.