前几天操作 edas 时,莫名其妙,把我们俩主机直接释放了,毛都没剩,手机验证码也没,甚至都没个弹框确认
后来发工单,客服确认是阿里云代码 bug,然后说送我 500 代金券??
我们加班加点弄了一晚上才重建了生产环境哦,马爸爸你也好意思?
你们说说还有没有王法了
后来发工单,客服确认是阿里云代码 bug,然后说送我 500 代金券??
我们加班加点弄了一晚上才重建了生产环境哦,马爸爸你也好意思?
你们说说还有没有王法了
1
saberlove Jan 29, 2018
没有
|
2
ericguo Jan 29, 2018
没有
|
3
fange01 Jan 29, 2018
吓得我,赶紧备份一下几个 ECS
|
4
riggzh Jan 29, 2018 马爸爸:你都叫我爸爸了,心里有点熟
|
5
rogwan Jan 29, 2018
这是灾难级故障啊。自动快照和镜像系统给你保留了吗?
|
6
est Jan 29, 2018 via Android
没有
|
7
misaka19000 Jan 29, 2018 via Android
楼主看来已经准备好了一千万了
|
9
liuzhedash Jan 29, 2018
这太严重了吧,要是 ECS+快照一起消失,那可真是毛都没了
|
10
salmon5 Jan 29, 2018 via Android
这 bug 太可怕了
|
11
huntzhan Jan 29, 2018
原来阿里云是没有 SLA 的么。
|
12
publicAdmin Jan 29, 2018 再补个刀,
前公司苦于没有运维,图省事,买了阿里云的 redis... 2G 的 redis 数据直接清空,最后补偿了一张互联网大会门票。。。。 |
13
fengyj Jan 29, 2018
@publicAdmin 这操作稳啊。还好我用的是腾讯云。
|
14
Livid MOD PRO @misaka19000 请不要再回复“一千万”这种毫无意义的内容。
|
15
codeeer Jan 30, 2018 via iPhone
楼主的主机开通多久了?距离续费多久?阿里最近有点疯狂,我们的香港反代节点不定时被封,网络连接情况也不太好
|
16
mritd Jan 30, 2018 via iPhone
看完各位遭遇......我是真特么不敢用了
|
17
pmispig Jan 30, 2018
edas 这个巨坑我算是出来了,改用 spring cloud,不用好舒服了。
|
18
Rickkkkkkk Jan 30, 2018
不是自家的 SRE, 出了问题只能看合同.
翻一翻用他家云时点同意的那份用户协议吧. |
19
realpg PRO 目测跟楼主同一波
客户数据盘没了 而且没了还在计费 然后计费取消不说 给了点代金券……重新挂了个盘 |
20
miyuki Jan 30, 2018 via Android
厉害了
|
21
zhouquanbest Jan 30, 2018
还好现在用 AWS
一年多了没出过任何问题 |
22
skydiver Jan 30, 2018 via Android
一晚上才重建,还是反思一下自己的容灾恢复做的哪里不好吧
|
23
515576745 Jan 30, 2018 via Android
套路云
|
24
imbushuo Jan 30, 2018
你们需要用 Chaos Monkey 这样的东西测一下自己架构的可靠性
|
25
zlfzy Jan 30, 2018 via iPhone
马云都说了 99.9999%数据可靠性
|
26
odirus Jan 30, 2018 via Android
我们没有遇到,遇到了也会在几分钟内恢复。
所有业务全部部署了两组不同可用区的服务器,重要服务器快照频率很高,前面放了负载均衡。 如果要恢复,直接从快照恢复,几分钟的事情。 用了几年,并没有遇到啥大问题,只是偶尔有服务器突然死机,不过有负载均衡在,用户并不会感知到。 |
29
CEBBCAT Jan 30, 2018 via Android 楼主节哀,以后多用快照,换家服务商吧;
我觉得楼上有几位有洗地的嫌疑; 这种大事故当事人心情至少不是愉快的,在这种时候还说一些 “ 啥?一晚上才把环境搭起来?这也忒慢了吧?我司 256 组 raid 全球部署,这种事件根本不能奈何我们,自己找面墙反思反思吧“ ,这反映似乎不是常人该有的反应 |
30
lun10439547 Jan 30, 2018 via iPhone bug 无法避免,赔偿方案太恶心!
|
32
goofcc Jan 30, 2018
这小子估计怕公司追究,私下找你私了了,
|
33
huangunic0rn Jan 30, 2018 via Android
@CEBBCAT 阿里释放机器会同时删除自动创建的快照 😹
|
34
hugee Jan 30, 2018 via Android
5w 都不能接受
|
35
whileFalse Jan 30, 2018
AWS 感觉良好。
|
36
shirakun Jan 30, 2018
中国厂商都这个样,重要数据还是尽快搬离中国大陆吧
顺便上面发现一只公关人员 |
37
liteyou Jan 30, 2018 via iPhone |
38
sjwuny Jan 30, 2018
@publicAdmin 脑子有屎吧
|
39
jeffersonpig Jan 30, 2018 楼上某些洗地真的是令人恶心。V 站什么时候做个踩的功能
|
40
yls258 Jan 30, 2018
可以放图么 另:500 券随便用么
|
41
sjwuny Jan 30, 2018
吓得我赶紧创建了个快照
|
42
boyxupers Jan 30, 2018 via iPhone
SLA 好像是按照不可用时间赔付吧,就 ECS 这种没准赔你 100 都算多的。但,故障就不一样了,建议提工单质问吧。不过楼主还是确认下是否有自己操作失误的可能性。
|
45
v2chou Jan 30, 2018
好像赔偿大多是给 <b>代金券</b> 的
|
46
hasbug Jan 30, 2018
。。。
|
47
caniuse Jan 30, 2018
我买的腾讯云,专搞公众号 小程序
|
49
wekw Jan 30, 2018
是欠费导致的吗?如果不是这就严重了,可以起诉赔偿。
话说我都做好了阿里云大兴机房被炸以后的灾备准备了。 |
50
kingda Jan 30, 2018
阿里云,我这么相信你,你竟然背叛我?
|
51
aisk Jan 30, 2018
没有。
|
52
longggg Jan 30, 2018
SLA ? https://help.aliyun.com/knowledge_detail/40683.html
按照合同来呗. 我看写的是 100 倍, 找你们销售或市场去谈就行吧. 如果算故障了 12 小时, 那每台 ecs 就应该是: 43200 * 100 * min_price, 建议以后可以有 snapshot, 不怕一万, 就怕万一啊! |
53
ooooo Jan 30, 2018
这个很严重啊! 还好楼主没有重要数据在里面,阿里快照记得收费了吧?
|
54
atcdef Jan 30, 2018
这是灾难级的了吧,不过国内情况,只能自认倒霉,没啥好办法。
另外,BS 一下上面洗地的,你的良心不痛么? |
55
guoyuchuan Jan 30, 2018
怎么洗地
|
56
niunan Jan 30, 2018
支持支持
|
58
WendellSun Jan 30, 2018
还能这样。。
|
59
jokerjoker Jan 30, 2018
@skydiver 这是什么逻辑,难道用户买了资源,不是希望一直不挂的用下去吗,你愿意重新搞一次嘛
|
60
aileswang Jan 30, 2018
aws 国内除了贵点都还行。。
|
61
Felldeadbird Jan 30, 2018
这 BUG 也太可怕了。以前我向人推荐阿里云是因为可以省去运维成本。看来还的自己请运维了。
|
62
skadi Jan 30, 2018
aws 或者 azure
|
63
wizardry Jan 30, 2018
看来还是得备份一份线下存起来
|
65
nciyuan Jan 30, 2018 via Android
Dropbox 真的好用啊嘻嘻嘻嘻嘻嘻
|
67
Zzzzzzzzz Jan 30, 2018
觉得 aws 不会出这种事的自行搜 ebs volume data loss, 案例又不少, 倒不是给阿里洗地, 楼主这事很明显责任就是阿里云的
但是就数据保障这点来说, 可靠性是靠钱做冗余和备份堆出来的, 存储介质或者服务商单方面再可靠都是靠不住的 |
68
qoras Jan 30, 2018
用套路云, 一边要小心扣费, 另一边还要担心灾备
建议换 aws |
69
rswl Jan 30, 2018
花了钱还不省心……这
|
70
gcg0036 OP 事情就这样啦,感谢同仁鼓励!
|
71
fredcc Jan 30, 2018
@Zzzzzzzzz AWS 官方有 EC2 和 EBS 的 SLA 协议 https://www.amazonaws.cn/ec2/sla/beijing/ 看起来是 99%左右,并且官方明确建议不要把单台实例或者单个 EBS 卷视为可靠不丢失的资源。对比楼主的案例,aws 的场景应该是多可用区 RDS 或者 ElasticCache 服务器宕机丢失数据吧
|
73
dianso Jan 30, 2018 via iPhone
无图无真相 真假难说
|
76
bookit Jan 30, 2018
别用云。。。
|
77
cherrybob Jan 30, 2018
没有竞争,国产保护的都是劣质厂商
|
78
ted05 Jan 30, 2018
阿里云的产品好贵啊!为啥还那么不靠谱
|
79
panzhc Jan 31, 2018
楼主可以具体说下是怎样的操作触发了这个 Bug 吗?
|
80
gcg0036 OP 删掉 edas 所有应用,然后删掉 swarm 集群,前提是你是按量付费 ecs,这时候就会自动释放
现在应该已经修复了 |
81
fuermosi777 Jan 31, 2018
一条普通的回复也会被站长审查....叹
|
82
opengps Jan 31, 2018
这个概率真够低的啊
|
83
Livid MOD PRO 每次阿里云一出什么事情,就有人马上要抖那个“一千万”的梗。
当这些人在抖这个“一千万”的梗的时候,除了能够帮助阿里云恐吓楼主之外,还有什么任何帮助呢? 这种无聊的回复就和“路过”,“顶”,“不明觉厉”一样,毫无信息量。 |
85
Livid MOD PRO @qcloud 你说话的这个逻辑我实在看不懂,搅稀泥也不是这样搅的。从反对一条一千万的无意义回复,可以演绎为“一切回复都没有意义了吗”,这是什么神逻辑?
|
86
qcloud Jan 31, 2018
@Livid #85 我前面已经说了别太较真...难道你没看懂吗......你觉得一千万没有意义,但是别人觉得有意义啊,不知道你为什么要干涉....你在这下面回复的这些话,对楼主有什么意义吗?
|
87
Livid MOD PRO @qcloud 这个世界上所有的意外事故,比如无故释放生产环境中的虚机,虽然有 SLA 但是并不当真,都是那些不较真的人才会搞出来的破事。
|
91
sixdian Jan 31, 2018 via Android
我的地盘我做主
|
92
46fo Jan 31, 2018 一千万的梗比 路过 顶 有意义吧,不知道的人会去搜历史,知道的人会更严谨检查自己的提问。
|
94
ctsed Jan 31, 2018 via Android
观众朋友们,以上就是 v 站枪毙名单,本期节目到此结束
|
95
fbcskpebfr Jan 31, 2018 via Android @KaoN 正面回答楼主的在正文末尾提出的问题并直接了当地给出否认的答案。快速准确得到答案,这也是 v 站优于其他专门的问答网站的优势所在
|