1
lDqe4OE6iOEUQNM7 362 天前 8
开猿节流,降本增笑
|
2
lDqe4OE6iOEUQNM7 362 天前
常规的 bug,不可能宕机这么久
|
3
zfy941 362 天前
了解底层和能解决底层问题的人被优化了
写 ppt 的人发现怎么写 ppt 也解决不了问题 |
4
stinkytofu 362 天前 4
越底层的服务, 平时越不显眼, 开发维护人员越得不到重视, 甚至都写不了漂亮的 KPI
|
5
weiweiwitch 362 天前
@stinkytofu 这其实也是做后端特别是底层基础设施的人的苦和原罪。
即使公司很重视,但因为是保障性工作。也是非常依赖技术人的职业道德和自律来维持。管理层做的最多,也只能像菩萨一样供着,但也无法一定保证不出问题。 |
6
bt7vip 362 天前 via Android 4
遇到 xfs 系统因为驱动缺陷,空间被占满导致宕机,重启后,挂载没有报错,执行任何读写操作都会报错,存在块错误。
可以解决吗? 常规方法,校验文件完整,进行修复。 能做吗--不做。 20t 数据,因为几个块数据没写入,就造成整个系统文件损坏,校验就要校验 20T ,还不保证数据能恢复。 有人能做吗--有,找精通 xfs 的人处理。 费用谁出,手动修复失败谁背锅。非在职人员处理接触业务,出了问题谁担责。 招一个???刚裁掉。 |
7
zhaojiaxing OP @bt7vip 艹,悲哀啊
|
8
zhaojiaxing OP @weiweiwitch 确实会这样,太难了
|
9
dode 362 天前
滴滴作为上市公司有义务公布这个故障详细原因吗?
|
10
kokutou 362 天前
oa 系统数据库在一个 Linux 服务器上,
磁盘是 lvm thin 的, 格式是 xfs 硬盘没有满, 但是为啥程序报错了, 写入不了了呢... 检查发现 meta 满了.... |
11
fxxkgw 362 天前 via Android 1
K8S 多了就不透露了
|
12
zong400 362 天前
#6 #10 是真相?
|
14
iyiluo 362 天前
整天说高可用,容灾,异地部署,怎么一台机器挂了就全挂了
|
15
crazyTanuki 362 天前
裁员省的钱和出问题亏损的钱,哪个多?
|
16
Goooooos 362 天前
|
17
LeibnizLeo 362 天前
学到了学到了
|
18
shengmi 362 天前
道理都懂,先别急~让开车的上下班先爽几天
|
19
zhaojiaxing OP @Goooooos 好像都在传这个版本
|
20
buffzty 362 天前
18 个小时才修复 肯定就不是技术问题 而是经验问题了 有些软件一旦升级就出错 而且这个错你搜不到 就是无法运行 除非你以前搞过 不然就慢慢从底层往上研究吧 他们 18 个小时才好 说不定以前负责这个的人改个参数就重启好了
|
22
Goooooos 362 天前
|
23
V2Q 362 天前
我乱说的,会不会被黑了,前不久的阿里 ,这次的滴滴,下一个 xxx
|