This topic created in 609 days ago, the information mentioned may be changed or developed.
服务器上一直不停报错没注意,跑了几个月,竟然把 journal 的日志占满了。journal 日志一直没限制。后来清理的时候发现大概占了硬盘空间的 80%左右,其实是发现 ssh 登不上去了才发现这个问题。
商家的 vnc 也因为硬盘满了,tty 进不去。
还好进救援模式才进去了,不然只能重装了。一看是真的 100%,一点也没有空余空间了。
期间还发现了如果硬盘满了,挂载里面 loop 文件也挂载不上去,提示“块有问题”。清理完后就行了
后来复盘的时候才发现是一个 loop 硬盘满了,读写一直失败。导致宿主机一直记录这个失败日志,导致宿主机硬盘也满了。
硬盘满了后,感觉有不少软件会卡在 syslog 或者其他 log 函数上。很多软件都会出现预期之外的行为。
22 replies • 2024-09-24 11:07:25 +08:00
 |
|
1
wacxr123 Sep 15, 2024 via Android
确实,我的经验是如果按 Tab 无法自动补全路径,就知道是盘满了(
|
 |
|
2
flynaj Sep 15, 2024 via Android
这个时候你就知道 zabbix 的好处了。
|
 |
|
3
Donaldo Sep 15, 2024
我中招过几次,但我一堆服务器总是懒得去设置,其实可以设置一下 rotate 或者过期日期,要不迟早有满的一天。。。啊,好累。。。
|
 |
|
4
Kumo31 Sep 15, 2024
这些行为就是预期内的,只不过大部分软件的设计者就没考虑处理这种情况。我们还有一个专门的避免任何 IO 的程序去做这种情况下的节点降级处理
|
 |
|
5
june4 Sep 15, 2024
我自己写了个快满了无限 5 分钟发一次邮件的定时任务,放在我的 linux 服务器初始化安装脚本里。
#!/bin/bash -e if [[ -f /etc/default/disk-usage-agent ]]; then . /etc/default/disk-usage-agent fi max_usage=${max_usage:-90} usage=$(df | grep -e '/$' | awk '{print $5}' | tr -d %) if (( usage > max_usage )); then warnmsg="WARNING: disk-usage-agent: exceeds max usage: $usage%" echo $warnmsg >&2 df -h | /opt/util/bin/mailadmins "$warnmsg" - fi
|
 |
|
6
totoro625 Sep 15, 2024
某些程序的写入操作是删除原有数据再写入(并不是追加和修改),硬盘已满的情况下这样会导致文件丢失 这里点名 acme
|
 |
|
7
kneo Sep 15, 2024 via Android
这不叫 bug 。举个再极端的例子,你电脑断电了程序挂了,你能说这是软件 bug ?
|
 |
|
8
L4Linux Sep 15, 2024
你们运维在干啥? logrotate 都不跑一下的吗?
|
 |
|
9
dfdd1811 Sep 15, 2024
所以虽然我自己只有三台机器,但我还是用 prometheus+grafana…
|
 |
|
10
wheat0r Sep 15, 2024
这事最大的 bug 是有人把硬盘跑满了
|
 |
|
12
wolonggl Sep 15, 2024
磁盘满了。依赖在磁盘创建临时文件基本收到影响, 报告/tmp 空间满了后,一大堆软件受影响
|
 |
|
13
flyqie Sep 16, 2024
这个其实蛮正常的。
毕竟不同软件的内部流程是不一样的,自然是没法统一的。
并且说真的。。应该设个剩余空间报警,不然很麻烦。
|
 |
|
14
Yii234 Sep 16, 2024
 最基础的主机监控告警都没有,是生产服务器吗?
|
 |
|
15
PerFectTime Sep 16, 2024
想起来之前看到的一个段子,新拿到服务器先 dd 一个 10g 的空文件,等到磁盘满了删除该文件以快速解决磁盘占用满的问题
|
 |
|
16
sunxvvv Sep 16, 2024
硬盘满了,数据无法写到硬盘上,程序和内核的部分功能无法正常完成,不出问题才不合理吧......
|
 |
|
19
FrankAdler Sep 17, 2024
/usr/bin/journalctl --vacuum-size=50M 放定时任务把
|
 |
|
22
dode Sep 24, 2024
升级系统命令好久都执行失败,提示请求源错误,后来看一下,系统根目录空间满了。
|