V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
netnr
V2EX  ›  问与答

内网系统嵌公网站点首页

  •  
  •   netnr · 2019-09-16 16:08:44 +08:00 · 1378 次点击
    这是一个创建于 1928 天前的主题,其中的信息可能已经有所发展或是发生改变。
    情况:
    内网系统,嵌公网的一个站点,仅首页,发现更新要及时更新

    目前的办法是:
    wget 爬取,在加上手工处理异步请求的资源,一个一个分别下载到对应的目录下

    问:
    那基于现目前的状况,有没有更好的办法来做这个事情,能脚本化是最好的
    各种奇技淫巧都行
    4 条回复    2019-09-16 18:21:34 +08:00
    letitbesqzr
        1
    letitbesqzr  
       2019-09-16 16:42:15 +08:00
    反向代理不就好了?
    netnr
        2
    netnr  
    OP
       2019-09-16 16:43:11 +08:00
    这个是最优的,但是不行
    zacharyjia
        3
    zacharyjia  
       2019-09-16 17:07:22 +08:00
    这事儿写个 Python 脚本好像挺合适的啊,用爬虫的那套来解析最新的内容会有问题?
    netnr
        4
    netnr  
    OP
       2019-09-16 18:21:34 +08:00
    @zacharyjia 有异步
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5251 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 05:46 · PVG 13:46 · LAX 21:46 · JFK 00:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.