V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Co1a
V2EX  ›  DevOps

大家容灾是怎么做的?

  •  
  •   Co1a · 2021-08-31 11:57:37 +08:00 · 3935 次点击
    这是一个创建于 959 天前的主题,其中的信息可能已经有所发展或是发生改变。

    工作不到半年,公司给的服务器出现了一次硬盘挂掉、一次系统宕机,想问问各位的容灾是怎么做的。

    17 条回复    2022-03-28 21:32:43 +08:00
    yanzhiling2001
        1
    yanzhiling2001  
       2021-08-31 12:01:53 +08:00
    加钱上 raid50, 到现在跑了三年了,除了被机房坑过,断电一次没问题。
    psirnull
        2
    psirnull  
       2021-08-31 12:04:51 +08:00
    两地三中心+同城异地
    sggggy
        3
    sggggy  
       2021-08-31 12:12:19 +08:00
    服务器迁移上云,用 VPN 打通连接,当内网用。灾备方案用云商的方案。
    wzw
        4
    wzw  
       2021-08-31 12:14:58 +08:00 via iPhone
    快照够不够,😄
    ByteCat
        5
    ByteCat  
       2021-08-31 13:01:31 +08:00
    3-2-1 备份
    markgor
        6
    markgor  
       2021-08-31 14:31:46 +08:00   ❤️ 1
    8 年前,
    业务服务器就是普通 PC,linux 数据盘软 raid1,系统盘没 raid.
    监管要求保留 3 年,通过 crontab 每天中午 12 点|下午 6 点|晚上 10 点 抄过去 PDC 。
    PDC 通过 crontab 凌晨 2 点 tar 当日文件 抄到 异地 PDC 。
    两台 PDC 都是硬 RAID 1 。
    但是硬盘都是用家用盘。

    当时手上是保留业务服务器的系统盘一份,
    出问题的时候就咚咚咚的跑去机房,
    看看是硬盘问题还是其余问题,
    如果硬盘故障就换一个新的上去,看看同步情况,
    如果不是硬盘故障就直接换备用机上。

    当时这种方式用了 5 年,硬盘也只是出过 2 次故障,而且都不是数据盘,是系统盘。
    那时候无非就替换个系统镜像盘上去就好了...业务中断也是 30 分钟内....
    hervey0424
        7
    hervey0424  
       2021-08-31 15:11:39 +08:00
    U 盘
    Rwing
        8
    Rwing  
       2021-08-31 15:23:33 +08:00
    最基本的双机热备,定时冷备
    wudidangteng
        9
    wudidangteng  
       2021-08-31 15:35:57 +08:00
    系统盘 raid1 数据盘 raid10
    SuperManNoPain
        10
    SuperManNoPain  
       2021-08-31 15:36:34 +08:00
    😅没有容灾
    hccsoul
        11
    hccsoul  
       2021-08-31 17:22:27 +08:00   ❤️ 2
    我一定是格局不够 我想的崩了正好可以摸鱼。。
    eudore
        12
    eudore  
       2021-09-01 09:33:31 +08:00
    没钱
    libook
        13
    libook  
       2021-09-01 11:22:15 +08:00   ❤️ 1
    #2 楼两地三中心+同城异地,短短几个字,基本能覆盖大多容灾能力了。

    上云的话,云厂商就能提供大多数容灾能力了。

    存储容灾上冗余阵列+异地备份;系统容灾至少有双节点,确保一个挂掉另一个可以马上工作。
    找家一本正经的等保测评机构花钱做个二级或三级的测评(现在公安都要求每年至少做一次吧),他们会引导你们考虑解决天灾人祸导致主机房直接消失的情况。
    Eytoyes
        14
    Eytoyes  
       2021-09-01 17:23:54 +08:00   ❤️ 1
    自己用的就是多个磁盘,热数据和冷数据还有重要数据,6 个盘,重要数据软 raid1,冷数据休眠、热数据在线,一般就是照片视频,文档都在 OneDrive 上面

    单位用的就看领导花多少钱了,反正现在领导不重视备份,硬件都是沾亲带故的承包,甚至买的阵列用的三桑的家用 tlc 固态,已经麻了,丢了关我屁事。
    d0wnl0ad
        15
    d0wnl0ad  
       2022-02-24 21:00:46 +08:00 via Android
    @libook 有啥靠谱的等保评测介绍吗,坐标上海
    libook
        16
    libook  
       2022-02-25 10:11:03 +08:00
    http://www.djbh.net/webdev/web/LevelTestOrgAction.do?p=nlbdLv3&id=402885cb35d11a540135d168e41e000c
    这个是公安的等保官网,有公安颁发资质的等保测评机构的目录,你按照你们所在地区找几家联系看看,货比三家。
    shequ2046
        17
    shequ2046  
       2022-03-28 21:32:43 +08:00
    容灾说实话已经远远超过这边的平均水平了。。。
    国内有认真的容灾策略的也就那么几家外企吧。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1035 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 22:34 · PVG 06:34 · LAX 15:34 · JFK 18:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.