群晖,硬盘是两块西数 14T ,DC HC530 ,都是淘的二手,2w 小时左右,现在出问题这块 2.7w 小时,另一块 3.3w
群晖是去年 6 月买的,之前一直没注意,因为硬盘状态那里一直显示良好,前段时间点开才发现,从去年 12 月开始,一块硬盘的 SMART 快速检测结果就是“建议执行完整测试”,点了完整测试,结果为“需要注意,请持续监控您的硬盘状态”。
请问,这样是不是硬盘快要挂了的迹象啊。
有意思的是,出问题的这块硬盘从一开始温度就比另外一块高 2℃,现在是 3℃
1
julyclyde 4 天前
过于拐弯抹角了
有原始结果可以看吗? |
![]() |
2
bananahotell OP @julyclyde 没有原始结果啊,就我上面说的大概结果,没有具体数据,我搜了一圈,也没发现可以检测的套件
|
![]() |
3
FeranyDev 4 天前
直接 ssh 上去看原始信息
|
4
6a82aa9bfe 4 天前 via Android
看你存的数据有多重要,如果是什么丢了会让你痛不欲生的,赶紧换硬盘,如果是无关紧要的,放心用到他挂为止
|
5
luoshengdu 4 天前 ![]() @julyclyde 群晖 7.x 版本后,把 smart 的详细信息隐去,不给看了。 楼主拐弯是群晖坑。
github 上有群晖的 smart 增强显示工具,ssh 下查看。https://github.com/007revad/Synology_SMART_info @bananahotell 我记得还有通过安装 docker 来实现 web 界面友好查看装的。 |
6
JustBecause 3 天前
有做冗余吗?有的话就不慌,我的盘也感叹号了,也是矿渣,观察了小半年没有继续增加的趋势,继续用着先,等挂了再换
197 Current pending sector 0x0022 100 100 000 Old age Always Never 24 198 Offline uncorrectable 0x0008 100 100 000 Old age Offline Never 3 |
7
julyclyde 2 天前
既然没有详细信息,那我瞎猜一个:
relocation 数量增加了 但是剩余的备用区还没耗尽? |
![]() |
8
bananahotell OP @FeranyDev
@6a82aa9bfe @luoshengdu @JustBecause @julyclyde 感谢各位的回复,按教程弄了一下,不知道对不对,看起来似乎没问题? Drive 2 WDC WUH721414ALE604 9RGDVGPC SMART overall-health self-assessment test result: PASSED SMART Error Counter Log: No Errors Logged ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE 1 Raw_Read_Error_Rate PO-R-- 100 100 001 - 0 2 Throughput_Performance P-S--- 138 138 054 - 92 3 Spin_Up_Time POS--- 081 081 001 - 384 (Average 384) 4 Start_Stop_Count -O--C- 097 097 000 - 1322 5 Reallocated_Sector_Ct 100 100 001 - 0 7 Seek_Error_Rate PO-R-- 100 100 001 - 0 8 Seek_Time_Performance P-S--- 133 133 020 - 18 9 Power_On_Hours -O--C- 097 097 000 - 27825 10 Spin_Retry_Count 100 100 001 - 0 12 Power_Cycle_Count -O--CK 100 100 000 - 65 22 Helium_Level PO---K 100 100 025 - 100 192 Power-Off_Retract_Count -O--CK 100 100 000 - 1989 193 Load_Cycle_Count -O--C- 100 100 000 - 1989 194 Temperature_Celsius -O---- 055 055 000 - 39 (Min/Max 13/54) 196 Reallocated_Event_Count 100 100 000 - 0 197 Current_Pending_Sector 100 100 000 - 8 198 Offline_Uncorrectable 100 100 000 - 3 199 UDMA_CRC_Error_Count -O-R-- 100 100 000 - 0 Drive 1 WDC WUH721414ALE6L4 Y5KX0WDC SMART overall-health self-assessment test result: PASSED SMART Error Counter Log: No Errors Logged ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE 1 Raw_Read_Error_Rate PO-R-- 100 100 001 - 0 2 Throughput_Performance P-S--- 138 138 054 - 96 3 Spin_Up_Time POS--- 081 081 001 - 387 (Average 385) 4 Start_Stop_Count -O--C- 100 100 000 - 30 5 Reallocated_Sector_Ct 100 100 001 - 0 7 Seek_Error_Rate PO-R-- 100 100 001 - 0 8 Seek_Time_Performance P-S--- 133 133 020 - 18 9 Power_On_Hours -O--C- 096 096 000 - 33292 10 Spin_Retry_Count 100 100 001 - 0 12 Power_Cycle_Count -O--CK 100 100 000 - 30 22 Helium_Level PO---K 100 100 025 - 100 192 Power-Off_Retract_Count -O--CK 100 100 000 - 1259 193 Load_Cycle_Count -O--C- 100 100 000 - 1259 194 Temperature_Celsius -O---- 057 057 000 - 37 (Min/Max 14/51) 196 Reallocated_Event_Count 100 100 000 - 0 197 Current_Pending_Sector 100 100 000 - 0 198 Offline_Uncorrectable 100 100 000 - 0 199 UDMA_CRC_Error_Count -O-R-- 100 100 000 |
![]() |
9
bananahotell OP 不知道怎么发图,看起有点乱
|
![]() |
10
bananahotell OP 找 chatgpt 咨询了一下:
可能的警示项 Current_Pending_Sector ( ID 197 ):值为 8 这意味着有 8 个扇区正在等待重新分配,通常表示可能存在读写问题或者即将发生的坏道。如果这个数值持续增加,可能说明硬盘有物理损伤。 建议运行 完整磁盘扫描(如 chkdsk /r 或 badblocks )来确认是否有无法修复的坏扇区。 备份重要数据,以防未来恶化。 Offline_Uncorrectable ( ID 198 ):值为 3 代表有 3 个不可恢复的错误,可能是读取数据时出现了错误,表明磁盘的某些部分可能已经损坏。 结合 Current_Pending_Sector ( ID 197 ) 的情况,说明硬盘可能有轻微的物理损伤或数据损坏。 |
11
supty 2 天前
197 Current_Pending_Sector 100 100 000 - 8
当前挂起的扇区有 8 个,意思是有 8 个扇区可能已出现了问题 198 Offline_Uncorrectable 100 100 000 - 3 离线不可恢复的扇区有 3 个,是表示硬盘已出现了 3 个不能修复的扇区 结合上面 2 个数据看基本已确定硬盘有坏道了,可以把这个 2 号盘卸载掉 用 fsck 带修复参数完整检查一下磁盘,14T 大概需要 1 天左右,检查完后,确认是坏扇区 197 这个挂起的扇区数据应该会被清空,真有 8 个坏道,会直接转入到 05 项 的重分配里去 5 Reallocated_Sector_Ct 100 100 001 - 0 如果正好有存储在这 11 个坏扇区上的文件,可能是零碎的小文件,也可能是大文件,都会导致 其损坏. 确认是最终的 05 项值增加了,这个硬盘基本都要更换的,一般坏道后续会扩散 |
12
dilidilid 1 天前
@luoshengdu 那群晖真是换着花样恶心个人用户了呢
|