V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
thinkdiff
V2EX  ›  分享创造

做了个阿里云盘搜索工具 YaPan

  •  1
     
  •   thinkdiff · 2022-11-22 13:20:34 +08:00 · 10503 次点击
    这是一个创建于 723 天前的主题,其中的信息可能已经有所发展或是发生改变。

    地址 https://pan.ccof.cc

    支持PWA ,可以添加到桌面

    以后不用看到好东西就存自己网盘占空间了。

    考虑做一个订阅功能,不知道有没有人感兴趣。

    67 条回复    2024-08-30 15:32:51 +08:00
    Xhack
        1
    Xhack  
       2022-11-22 13:33:16 +08:00
    再做个失效检测
    buyan3303
        2
    buyan3303  
       2022-11-22 13:39:59 +08:00
    以前有一个百度盘搜索比较好的网站,花点钱买网站的币,就能买资源下载,后来那个网站可能被发律师函了。
    lvsshuttao
        3
    lvsshuttao  
       2022-11-22 13:45:44 +08:00
    试了下不错,就怕很快下线了,要不搞个备份网址?
    buyan3303
        4
    buyan3303  
       2022-11-22 13:55:07 +08:00
    @lvsshuttao #3 更建议分享思路,不做成品,这样一般来说也不用考虑下线。
    SenLief
        5
    SenLief  
       2022-11-22 14:00:15 +08:00   ❤️ 1
    来个 TG Bot 这样就算是网页挂了,也还能接着用。
    wbwm
        6
    wbwm  
       2022-11-22 14:14:19 +08:00
    还以为是 yapian
    thinkdiff
        7
    thinkdiff  
    OP
       2022-11-22 15:25:54 +08:00
    @Xhack 是的,还得过滤需要密码的
    thinkdiff
        8
    thinkdiff  
    OP
       2022-11-22 15:27:09 +08:00
    @buyan3303 百度不行 下载速度太慢了 咱这个不收费,以后也不收费(如果能活到以后的话。。。)
    thinkdiff
        9
    thinkdiff  
    OP
       2022-11-22 15:29:55 +08:00
    @lvsshuttao 谢谢 资源还在不断丰富中 关注这个帖子 如果挂了 我再更新
    thinkdiff
        10
    thinkdiff  
    OP
       2022-11-22 15:30:59 +08:00
    @SenLief 用户量不多 再搞个 tg bot 貌似也没几个人用
    thinkdiff
        11
    thinkdiff  
    OP
       2022-11-22 15:32:36 +08:00
    @wbwm yapian = ya + pian 这个名字还蛮有意思的
    fhzyi
        12
    fhzyi  
       2022-11-22 15:38:44 +08:00
    试了下挺好的,如果能加一个筛选条件就更好了
    NeedforV2
        13
    NeedforV2  
       2022-11-22 15:44:27 +08:00
    试了下挺不错的,希望能长久
    tediorelee
        14
    tediorelee  
       2022-11-22 16:02:22 +08:00
    有无 pikpak 盘的..
    Ritter
        15
    Ritter  
       2022-11-22 16:26:16 +08:00
    什么原理呀
    entimm
        16
    entimm  
       2022-11-22 16:34:20 +08:00
    谢谢,如获至宝
    zhoujx
        17
    zhoujx  
       2022-11-22 16:54:27 +08:00
    这种一般是怎么实现的呢
    Asimov01
        18
    Asimov01  
       2022-11-22 17:16:46 +08:00
    试了好些东西都搜不到,自己分享过的东西也搜不到 😂
    iamcy
        19
    iamcy  
       2022-11-22 17:22:33 +08:00 via iPhone   ❤️ 1
    @buyan3303 云盘精灵吧,确实很好用,很多资源都能搜到。
    toan
        20
    toan  
       2022-11-22 17:28:49 +08:00
    嚯!速度好快,数据定时抓取的?
    asly
        21
    asly  
       2022-11-22 17:49:36 +08:00
    好厉害啊,已收藏~
    SenLief
        22
    SenLief  
       2022-11-22 18:14:24 +08:00
    好像无法直接定位过去啊
    amlee
        23
    amlee  
       2022-11-22 18:25:20 +08:00
    有点好奇,原理是啥
    viWww0vvxmolvY5p
        24
    viWww0vvxmolvY5p  
       2022-11-22 18:54:32 +08:00
    谢谢,现在收藏有三个搜索工具了。
    danhua
        25
    danhua  
       2022-11-22 18:55:26 +08:00
    同好奇这类的网盘搜索的原理是啥
    zhygkx
        26
    zhygkx  
       2022-11-22 20:12:05 +08:00
    好用 +1
    lincanbin
        27
    lincanbin  
       2022-11-22 20:21:41 +08:00
    做爬虫的都很刑
    lizhesystem
        28
    lizhesystem  
       2022-11-22 20:59:18 +08:00
    不错,速度很快。
    utre938722
        29
    utre938722  
       2022-11-22 21:38:12 +08:00
    同好奇这类的网盘搜索的原理是啥
    w3cll
        30
    w3cll  
       2022-11-22 21:49:34 +08:00
    @danhua 同好奇
    FightPig
        31
    FightPig  
       2022-11-22 21:54:13 +08:00
    试了下,挺快的啊
    jfds
        32
    jfds  
       2022-11-22 22:35:43 +08:00
    @mway 老哥分享下?
    Pogbag
        33
    Pogbag  
       2022-11-22 22:45:17 +08:00 via iPhone
    挺好用的,感谢
    flymeto
        34
    flymeto  
       2022-11-22 23:39:00 +08:00
    申请开源
    yukun666
        35
    yukun666  
       2022-11-23 09:03:45 +08:00
    好用
    好奇原理是啥
    op351
        36
    op351  
       2022-11-23 09:08:57 +08:00
    @Ritter
    我猜是从微博等平台上定向爬分享类博主的微博
    因为我搜了两部电视剧 结果都指向同一个分享账号
    estk
        37
    estk  
       2022-11-23 10:17:31 +08:00 via Android
    2013 年我做百度网盘搜索时,还收到优酷官方邮箱发的警告函
    pkwenda
        38
    pkwenda  
       2022-11-23 10:32:21 +08:00
    见过,但是一直搞不懂原理是什么 😂
    baisensenseng
        39
    baisensenseng  
       2022-11-23 10:47:28 +08:00
    我有个朋友说为什么搜不到波多野结衣?
    TomPig0216
        40
    TomPig0216  
       2022-11-23 11:02:32 +08:00
    搜了下 速度还挺快
    thinkdiff
        41
    thinkdiff  
    OP
       2022-11-23 11:37:52 +08:00
    感谢大家的鼓励和收藏,特别是给予我感谢的朋友。

    不出意料很多人对背后的原理感兴趣,这也是我喜欢 v2 的原因。其实不复杂,从网络上爬取公开分享的资源链接,并解析链接内的文件。将得到文件名和链接地址做成 KV 缓存到 MongoDB 。在搭建一个 WSGI ,做个搜索页面即可。

    主要到技术栈:Python / Scrapy / MongoDB / HanLP / Vue 3 / UnoCSS / NativeUI


    @zhoujx
    @amlee
    @danhua
    @utre938722
    @w3cll
    @yukun666
    @op351
    @pkwenda
    thinkdiff
        42
    thinkdiff  
    OP
       2022-11-23 11:46:28 +08:00
    做这个工具初衷是为了方便我个人使用。主要解决两个问题,一是存储空间,太多想要的资源无奈自己网盘空间有限。二是找资源效率,以前需要从各种渠道获取资源,有些还得爬楼找,遇到一个大合集还得进入合集内部搜索,效率太低。

    合规性是网盘搜索工具的共性问题,所以想向 V 有请教下如何尽量规避此类风险?

    如果像 @estk 那样收到官方告警函,网站会尽快下线,毕竟咱不获利,没必要引麻烦。

    如果有天网站被下线,我会考虑开源代码。

    @buyan3303
    @SenLief
    @NeedforV2
    @lincanbin
    @flymeto
    @estk
    estk
        43
    estk  
       2022-11-23 12:14:24 +08:00
    @thinkdiff #42
    2013 年优酷有一部新剧在上映,百度网盘有人传,我就采集到了,优酷没找网盘反而来找我。我就把哪部剧的名字放进搜索黑名单然后回复邮件告知对方,同时把百度网盘官方的举报链接也发给他们。这是网盘的责任,搜索引擎如果也要担责,那谷歌就是黄色网站搜集器
    viWww0vvxmolvY5p
        44
    viWww0vvxmolvY5p  
       2022-11-23 12:53:07 +08:00   ❤️ 1
    @jfds UP 云搜、猫狸盘搜
    thinkdiff
        45
    thinkdiff  
    OP
       2022-11-23 12:54:20 +08:00
    @estk 谢谢,学到了,我打算加个免责声明和举报功能 :)
    pkwenda
        46
    pkwenda  
       2022-11-23 14:11:16 +08:00
    @estk 👏🏻
    fenglingyu
        47
    fenglingyu  
       2022-11-23 14:16:39 +08:00
    楼主这个不错啊,以前用过几个,现在都死了
    weiliangweiliang
        48
    weiliangweiliang  
       2022-11-23 15:30:16 +08:00
    谢谢 op ,我拿来出版社 挺好用的
    macy
        49
    macy  
       2022-11-23 15:41:47 +08:00
    很不错,建议增加一个筛选功能,是文件夹还是文件,有些电视剧是在一个文件夹里有好多集,这样方便下载
    moranrs
        50
    moranrs  
       2022-11-24 10:17:47 +08:00
    感谢 op ,用这个我找到了一个很不错的电子书分享合集
    https://www.aliyundrive.com/s/sD4YdCPQx93
    yusifeng
        51
    yusifeng  
       2022-11-24 11:57:38 +08:00
    牛的
    heyleo
        52
    heyleo  
       2022-11-24 16:57:14 +08:00
    真的感谢楼主分享
    noshiro
        53
    noshiro  
       2022-11-25 11:46:36 +08:00
    感谢分享
    lion
        54
    lion  
       2022-12-02 23:39:41 +08:00
    建议在搜索页加个首页 log 点击返回的设计
    QuinYim
        55
    QuinYim  
       2022-12-05 16:48:19 +08:00
    感谢分享
    colarxu
        56
    colarxu  
       2023-02-13 15:54:34 +08:00
    在用了 谢谢!
    balduncle
        57
    balduncle  
       2023-04-13 22:08:45 +08:00
    很好。收藏了
    Act1ve
        58
    Act1ve  
       2023-04-19 11:59:45 +08:00
    "从网络上爬取公开分享的资源链接"

    好奇这个是咋实现的,因为 baidu ,google 加 site 过滤搜索的结果质量不好, 如果是自己用爬虫提取网页,你咋知道要爬些什么站点呀 😟
    SenseHu
        59
    SenseHu  
       2023-06-02 09:53:36 +08:00
    搜到想要的东西了,收藏了~
    koali123
        60
    koali123  
       2023-07-09 15:19:31 +08:00
    在用了 感谢分享 ~
    misasasaka
        61
    misasasaka  
       2023-07-10 00:51:03 +08:00 via iPad
    好像进不去了
    misasasaka
        62
    misasasaka  
       2023-07-10 00:52:37 +08:00 via iPad
    @misasasaka 我的问题
    fason1995
        63
    fason1995  
       2023-08-18 10:29:39 +08:00
    好用好用 搜索到我想要的资源了
    gniviliving
        64
    gniviliving  
       358 天前
    大佬。好像用不了,返回空
    thinkdiff
        65
    thinkdiff  
    OP
       347 天前
    @gniviliving 使用新域名访问 https://yapan.io
    deweixu
        66
    deweixu  
       270 天前
    https://yapan.io 域名也不能用了吗
    SAfte345
        67
    SAfte345  
       76 天前
    大佬,yapan.io 是不是下线了?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1577 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 17:11 · PVG 01:11 · LAX 09:11 · JFK 12:11
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.