V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
realpg
V2EX  ›  SSD

SSD 有风险,存储重要数据需谨慎。

  •  2
     
  •   realpg · 2020-08-03 10:05:44 +08:00 · 17014 次点击
    这是一个创建于 1574 天前的主题,其中的信息可能已经有所发展或是发生改变。
    当然,这是一个大家都知道的问题,因为遭遇了一些事,再出来强调一下。

    自然条件
    SSD: Intel 760p nvme
    时间: 购买约 110 天,上机约 80 天,平均每日通电时长 4-6 小时,写入量不多。

    今天用着用着,桌面背景图突然花了。



    以为显卡怎么样了,后来发现只有背景图花了一半。

    然后为了确保不是显卡问题,还是重启了下机器,确认不是显卡问题。

    然后去看图片文件



    果然,文件应该是有数据出现了异常变动

    用图片查看软件查看 花的风格还不一样




    这也幸亏是图片文件出现数据变了,可以直观发现。这要是什么重要数据出现了这种问题,就难办了。


    经过全盘扫描,固态硬盘健康度 100%,没有软硬件问题,就是简单的存储位数据变了,而且看图片估计不止一位。同时进行了 200GB 文件的规律文件再读取测试,还没测完,测完上结果
    130 条回复    2020-08-07 14:35:26 +08:00
    1  2  
    InkAndBanner
        1
    InkAndBanner  
       2020-08-03 10:14:51 +08:00
    我的硬盘最近也开始掉盘了 不过机械已经把重要数据备份了
    beingbin
        2
    beingbin  
       2020-08-03 10:17:27 +08:00
    这个问题是我没想到的,我以为楼主的盘挂了呢……我本子里是 15 年买的三星的 m2 ssd 128g 做的系统盘,通电大几千个小时,读写也蛮多的,暂时还未出现这种情况。
    wellsc
        3
    wellsc  
       2020-08-03 10:17:34 +08:00
    蜜汁画风
    nightwitch
        4
    nightwitch  
       2020-08-03 10:18:04 +08:00   ❤️ 1
    我的笔记本还是当年的东芝掉盘王 Q300,以至于我重要的东西都不敢往里放。。
    wunonglin
        5
    wunonglin  
       2020-08-03 10:18:54 +08:00
    其实还是多备份重要,机械硬盘也有丢数据的风险
    Osk
        6
    Osk  
       2020-08-03 10:19:51 +08:00
    我的一个压缩包, 解压时提示 crc 错误, 文件自从压缩后一直在 Intel 固态中.

    所以我觉得文件系统级的 crc 校验和 scrub 很重要.
    btrfs 和 ReFS 都有这两个 Feature, 但都有点坑
    chenset
        7
    chenset  
       2020-08-03 10:20:13 +08:00   ❤️ 11
    炮姐电磁波干扰了吧.
    Mithril
        8
    Mithril  
       2020-08-03 10:21:29 +08:00   ❤️ 1
    第一次见 SSD 这么坏的。
    不过一般也就当系统盘和游戏盘用,重要文件都放 NAS 里了。
    smartisan2047
        9
    smartisan2047  
       2020-08-03 10:21:37 +08:00 via Android   ❤️ 1
    重要文件异地备份
    selca
        10
    selca  
       2020-08-03 10:22:18 +08:00
    花得有点小酷
    iConnect
        11
    iConnect  
       2020-08-03 10:27:52 +08:00 via Android   ❤️ 6
    这个可能不是 ssd 的故障,正品 ssd 一般都有不少冗余空间,不会这么快出数据损毁的低级错误。大概率是系统、软件层面的问题。
    zhongjun96
        12
    zhongjun96  
       2020-08-03 10:28:12 +08:00
    一个东芝,拿来做时间机器备份,结果炸了,心累
    Sapp
        13
    Sapp  
       2020-08-03 10:30:55 +08:00
    这也太巧了吧,硬盘刚好坏到一个图片坏了一半... 我觉得还是检查一下有没有其他问题,固态硬盘确实不适合长期数据保存,但是你这种情况还真是第一次见到。
    imnpc
        14
    imnpc  
       2020-08-03 10:33:07 +08:00
    闪迪加强版 120G 的 批量买了 8 块 已经报废 3 块 提交售后直接换新了...数据全丢 无法读取
    CallMeReznov
        15
    CallMeReznov  
       2020-08-03 10:36:10 +08:00
    平常运行温度高??
    514146235
        16
    514146235  
       2020-08-03 10:38:41 +08:00   ❤️ 4
    这种情况 SSD 的锅的几率小于 0.1%
    elmagnificogg
        17
    elmagnificogg  
       2020-08-03 10:43:18 +08:00
    明显幸存者偏差
    Felldeadbird
        18
    Felldeadbird  
       2020-08-03 10:53:27 +08:00
    目前 SSD 没遇到这个问题。反而是西数的机械问题多多。
    vate32
        19
    vate32  
       2020-08-03 10:56:10 +08:00
    你图挂了
    cheng6563
        20
    cheng6563  
       2020-08-03 11:01:05 +08:00 via Android
    @wunonglin 这问题备份也解决不了吧,备份出去也是损坏的数据,还很难发现
    whileFalse
        21
    whileFalse  
       2020-08-03 11:02:40 +08:00
    第一张图花的好好看!
    whileFalse
        22
    whileFalse  
       2020-08-03 11:03:23 +08:00
    能把花了的文件贴上来吗
    reechangs
        23
    reechangs  
       2020-08-03 11:05:34 +08:00
    我一块用了七八年的 sandisk 的 ssd 没有任何问题,反观用西数和希捷的移动硬盘,倒是挂了好几块了。
    wsy2220
        24
    wsy2220  
       2020-08-03 11:07:01 +08:00 via Android
    多半是哪个软件 bug
    nicevar
        25
    nicevar  
       2020-08-03 11:09:21 +08:00
    楼主你是不是多个盘多个系统,并且在不同的系统下用过 VMWare
    ajaxfunction
        26
    ajaxfunction  
       2020-08-03 11:10:38 +08:00
    哈哈哈哈,十有八九是看图软件写入信息的时候没来得及关闭,进程被结束了
    nightwind
        27
    nightwind  
       2020-08-03 11:13:26 +08:00
    怎么确定是 SSD 的锅呢
    duixian
        28
    duixian  
       2020-08-03 11:13:36 +08:00
    我周末出现了一次系统盘掉盘,断电静置一段时间后重启又恢复了
    vk42
        29
    vk42  
       2020-08-03 11:14:26 +08:00
    如果是系统正常运行中挂的,应该不是 SSD 的问题。桌面图片开机之后基本上常驻内存,lz 有用什么自动换壁纸的工具?
    windfarer
        30
    windfarer  
       2020-08-03 11:16:02 +08:00 via Android
    你目睹了克苏鲁炮姐,san check, 成功-1 失败-1d6
    YuukiIchika
        31
    YuukiIchika  
       2020-08-03 11:16:13 +08:00
    有没有可能文件系统出问题了?
    6IbA2bj5ip3tK49j
        32
    6IbA2bj5ip3tK49j  
       2020-08-03 11:17:08 +08:00
    SSD 的哪有这个本事能够坏且只坏一个文件。显然是软件的锅。
    momocraft
        33
    momocraft  
       2020-08-03 11:17:52 +08:00
    110 天也太短了
    wzj9912
        34
    wzj9912  
       2020-08-03 11:19:24 +08:00
    特意登录来回复一下,我前几天桌面遇到了一模一样的问题,图片文件在 SSD 上,花法一模一样,但是窗口切过去切过来又好了,你说啥问题,玄学。还有就是我最近无聊循环测试 3-5 个 G 的大文件的 CRC (其实是在测试 SSE 里的 CRC 指令),读取了之后内存就缓存上了(第二次之后读取任务管理器硬盘性能栏就不动了而且速度超快,明显不是 HDD 的速度),然后一个文件几个测试样本里面中间(不是第一次读取)有个 CRC 就是突然不一样,怪内存?
    realpg
        35
    realpg  
    OP
       2020-08-03 11:24:34 +08:00
    @whileFalse #22
    今晚。花的是我家里的,刚出来上班了。
    另外,花了的那个,只有在桌面背景渲染是那个样子的,用其他软件打开不是那样的。
    要不要我桌面背景截图给你

    @nicevar #25
    不是。两块盘,这块还不是系统盘,是纯数据


    @ajaxfunction #26
    这个目录就是我的自动 wallpaper 目录,嗯,几百年没写过甚至没打开过。
    我找这个目录都找了半天……早忘了放哪里了


    @vk42 #29
    并没有 指定了一个目录作为 windows 背景目录 而且指定了几百年了从没换过,基本在装系统时候就指定。
    不过目录里文件不止一个且是随机,我真没留意这个之前加载过没有。另外这个机器只休眠不关机,不存在冷启动,只有发现问题时候我冷启动了一次。



    @xgfan #32
    这是磁盘的常见故障。无论机械还是固态都有,只是这次的故障 bits 刚好在一个图片文件里,直接肉眼可见了


    @chenset #7
    嗯,确认脸。
    alfchin
        36
    alfchin  
       2020-08-03 11:25:11 +08:00 via iPhone
    @iConnect 这个很正常的。数据校验位不足以覆盖存储区块损坏的校验任务了。
    区块损坏是随机事件,不会因为你的算法而能得到完全避免。
    whywhywhy
        37
    whywhywhy  
       2020-08-03 11:27:59 +08:00
    那假如是 2 个固态组 RAID1,出现这个故障后,会有什么现象呢?

    最近刚想给服务器上固态硬盘。。。。。
    liuribi
        38
    liuribi  
       2020-08-03 11:28:16 +08:00
    第一张花的图同求,有点好看啊
    EdgarZhang
        39
    EdgarZhang  
       2020-08-03 11:30:07 +08:00
    固态要坏都是整个挂的,没有听说过之坏一个文件的。
    文件损坏可能是系统或者其他软件的问题。
    所以重要文件在挪动后,尤其是网络传输后要做 MD5 的哈希校验。
    我现在只要在办公室就插着备份盘。一直备
    JamesMackerel
        40
    JamesMackerel  
       2020-08-03 11:30:15 +08:00
    我也说一下我遇到的两次类似的事情。

    第一次是我发现一旦 apt update 就报错,然后我 curl https 的网站,发现 curl 直接就 coredump 了,查看 dmesg 好像是 libgnutls 啥的出了问题。我想重新装一下这个包,但是又没法 https,又不想 http 。于是我在别的计算机上下载了一个这个包的 .deb ,安装后一切恢复正常。

    第二次是 curl 某些 https 网站说证书错误。结果我重装一下 ca-certificates 这个包就好了。不过当时已经知道 apt 源下下来的东西都有 pgp 签名校验,于是就直接全改 http 源就能访问 apt 源了。

    两次事情都出问题在 tls 相关的组件上面,你们说我是不是可以去买彩票了。
    realpg
        41
    realpg  
    OP
       2020-08-03 11:31:54 +08:00
    @whywhywhy #37
    如果在一致性校验检查之前你读取,那么大部分阵列卡的逻辑是并发从两块盘同时读,不会针对另外一块校验

    阵列卡对 RAID1 会在一定时间做一致性校验,也可以手动,叫做 CC
    如果是三块盘的 RAID1,会纠正不一致的一块,如果是两块盘的,我也不知道具体会怎么处理,但是确认 CC 之后两块盘都会一样。
    Nadao
        42
    Nadao  
       2020-08-03 11:35:16 +08:00
    什么系统没说?

    楼上也说了,我也觉得不一这是硬盘自己的问题。
    xingyuc
        43
    xingyuc  
       2020-08-03 11:36:32 +08:00
    炮姐电磁场太强大了 hhh
    whywhywhy
        44
    whywhywhy  
       2020-08-03 11:43:58 +08:00
    @realpg 谢谢,感觉老恐怖了。。。。
    gggxxxx
        45
    gggxxxx  
       2020-08-03 11:51:56 +08:00 via iPhone
    我怎么感觉是操作系统或者软件问题啊。
    nmap
        46
    nmap  
       2020-08-03 11:53:17 +08:00
    第一感觉这不是盘的问题
    alphatoad
        47
    alphatoad  
       2020-08-03 11:55:28 +08:00
    这个问题实在是很诡异呀,不是不可能,但几率实在是不大
    NTFS 有 checksum 吗?
    ily433664
        48
    ily433664  
       2020-08-03 11:59:32 +08:00
    感觉不是硬盘的问题,软件层面问题的可能性更大,固态要是出问题大概率就是整个硬盘都会出问题,只改变一个文件,不太可能
    Zhepro
        49
    Zhepro  
       2020-08-03 12:01:39 +08:00
    你的桌面是我的 discord 头像
    bullfrog
        50
    bullfrog  
       2020-08-03 12:05:35 +08:00
    硬盘坏了不会正好一张图片显示不出来,程序会先报错
    walsh
        51
    walsh  
       2020-08-03 12:06:21 +08:00
    OneDrive 一份 本地一份
    feiniu
        52
    feiniu  
       2020-08-03 12:25:23 +08:00 via iPhone
    @nightwitch 买回来第二天就掉盘,🐶
    zxxufo008
        53
    zxxufo008  
       2020-08-03 12:32:41 +08:00
    win10 自带的图片软件挺垃圾的,换一个试试
    sfqtsh
        54
    sfqtsh  
       2020-08-03 12:40:14 +08:00 via Android
    看了下,没啥实锤证据可以表明

    文件修改时间呢?
    coolan
        55
    coolan  
       2020-08-03 12:50:51 +08:00 via Android
    我也遇到过类似的,图片大规模出现半边色块。
    sockpuppet9527
        56
    sockpuppet9527  
       2020-08-03 12:52:55 +08:00
    看起来像是驱动的锅。。。
    reus
        57
    reus  
       2020-08-03 12:56:02 +08:00
    大概率是软件问题,SSD 本身有 crc 校验,错了还能正常读出来而不报错的概率极低
    freetes
        58
    freetes  
       2020-08-03 13:01:38 +08:00
    感觉“坏”掉的图片更好看了,来个原图吧
    dddd1919
        59
    dddd1919  
       2020-08-03 13:04:22 +08:00
    家里电脑换的 ssd,用了两年突然挂了。。。。可能是买的质量不行?七彩虹
    killerv
        60
    killerv  
       2020-08-03 13:17:38 +08:00
    有没有可能是软件问题
    imn1
        61
    imn1  
       2020-08-03 13:24:22 +08:00
    首先,你有没有关闭 windows 的碎片整理(含类似工具),如果没有,那并不能说明文件是万年不变,路径不变不代表存储位置不变,换言之,有写入操作,也就当然存在写入错误的可能

    其次也有读取错误的可能,这个就太复杂了
    Kagari
        62
    Kagari  
       2020-08-03 13:42:55 +08:00 via Android
    win10 下碎片整理默认不开吧
    可能是位翻转,从原来的途径重新把图片下下来用工具对比一下数据究竟差多少
    Clash
        63
    Clash  
       2020-08-03 14:09:19 +08:00
    看一半的图片,我以为是 晓 组织
    teruspot
        64
    teruspot  
       2020-08-03 14:10:44 +08:00 via Android
    以前京东东芝固态硬盘不是说经常掉盘吗
    initdrv
        65
    initdrv  
       2020-08-03 14:22:42 +08:00
    同用 INTEL SSDPEKKW256G8

    目前感觉使用正常(快两年了吧)

    另外,重要文件 dropbox 可以同步一份

    当然 buffalo 桌面移动存储也保留了一份

    That's all
    LokiSharp
        66
    LokiSharp  
       2020-08-03 14:23:01 +08:00
    这个是文件没写完就强行关闭了吧?
    UnitTest
        67
    UnitTest  
       2020-08-03 14:34:41 +08:00
    不得不说这花的还挺有艺术感。
    sunziren
        68
    sunziren  
       2020-08-03 14:37:43 +08:00
    会不会是你的电脑出现了自我意识,或者是外星人攻击了你的电脑
    hahaxo
        69
    hahaxo  
       2020-08-03 14:41:06 +08:00   ❤️ 1
    SSD 一般是 暴毙~~~
    PureWhiteWu
        70
    PureWhiteWu  
       2020-08-03 14:47:05 +08:00
    其实是被电磁炮击中了……
    Hellert
        71
    Hellert  
       2020-08-03 14:50:04 +08:00
    是不是云端备份导致的?
    nutting
        72
    nutting  
       2020-08-03 15:03:08 +08:00
    宇宙射线的锅
    Telegram
        73
    Telegram  
       2020-08-03 15:09:25 +08:00
    硬盘坏了还能有这种情况?你确定是硬盘问题?
    FirstSnow
        74
    FirstSnow  
       2020-08-03 15:15:37 +08:00
    如果花的位置调整到中间,还有点 glitch art 的感觉
    hearlessnor
        75
    hearlessnor  
       2020-08-03 15:21:38 +08:00 via iPhone
    ...你确定不是 win 某个软件的 bug,对图片产生了错误操作....
    raffaellolin
        76
    raffaellolin  
       2020-08-03 15:27:00 +08:00
    hdd 笑了一下走开了
    xratzh
        77
    xratzh  
       2020-08-03 15:35:13 +08:00 via iPhone
    P3700 和 s3700 在用,随便造
    soulzz
        78
    soulzz  
       2020-08-03 15:41:37 +08:00
    用啥 ssd,6 块机械硬盘组 raid0 它不香吗
    huamiao
        79
    huamiao  
       2020-08-03 15:53:44 +08:00
    量子物理的特色?
    domosekai
        80
    domosekai  
       2020-08-03 15:54:06 +08:00
    同感不是硬盘问题,你这图加载了一部分,然后花了,如果是硬盘问题,为什么前一部分可以加载后一部分统统不行?我碰到过一次这种,但我的情况是在更新新桌面的时候网络出错了,我觉得 lz 还是想想这桌面是不是有什么更新机制,被哪个软件搞了
    Jirajine
        81
    Jirajine  
       2020-08-03 15:55:59 +08:00 via Android
    硬盘出错的话应该不会错很多,还有原图的话 hexdump 出来对比一下错了多少位。
    OHyn
        82
    OHyn  
       2020-08-03 15:58:38 +08:00
    我遇到过一次,开了一个文档。。txt ?里面原本就有若干内容,然后突然断电关机,我想。。。起码原有内容是在的,结果开机后的发现原有的大部分内容也乱码了。
    OHyn
        83
    OHyn  
       2020-08-03 15:59:32 +08:00
    @soulzz 就现在机械的质量,我感觉这也挺恐怖的。。。我手里坏了 2 块硬盘了。
    realpg
        84
    realpg  
    OP
       2020-08-03 16:10:29 +08:00
    @Jirajine #81
    有原图 晚上回家我比照一下家里坏了的 顺便满足一下大家想要这个震撼效果图的需求
    我公司也是这 10 多个壁纸
    qdwang
        85
    qdwang  
       2020-08-03 16:29:11 +08:00
    lz 什么系统?据说 2004 刚出来的版本有损坏文件的 bug
    boboliu
        86
    boboliu  
       2020-08-03 16:47:37 +08:00
    我前两天一块 760p 也是刚刚挂掉,没有任何征兆就突然啥都没有了,推测应该是主控挂了,挂之前健康度也是 100%
    Caan07
        87
    Caan07  
       2020-08-03 17:07:07 +08:00
    重点不是应该是炮姐吗?(手动滑稽)
    ooh
        88
    ooh  
       2020-08-03 17:21:45 +08:00
    对不起,俺笑了😀
    sephinh
        89
    sephinh  
       2020-08-03 17:26:06 +08:00 via iPhone
    以前见这种半个空白的图是在某个垃圾 u 盘上
    joApioVVx4M4X6Rf
        90
    joApioVVx4M4X6Rf  
       2020-08-03 17:28:38 +08:00   ❤️ 1
    我靠这张图片我好喜欢,可以发给我做桌面吗
    xpfd
        91
    xpfd  
       2020-08-03 17:38:56 +08:00
    一般的 SSD 前后端都有加密校验 保证在存储过程中不会发送数据错误 存储到 Nand 上以后 发生比特位反转的可能性也很低, 除非是程序出问题,把数据对应的 mapping 表搞错了,但是如果数据 mapping 表错误的话 会导致很多问题,你这个问题分析一下,我感觉大概率不是 ssd 的问题,有可能是其他问题
    JimmyTinsley
        92
    JimmyTinsley  
       2020-08-03 17:43:55 +08:00
    有一说一, 炮姐花得挺好看
    openbsd
        93
    openbsd  
       2020-08-03 17:44:05 +08:00
    自从几年前 JD 官方买的两片 富士通 SLC FSX-120GB 轮流挂过一回后,就没在单盘 SSD 放过重要数据
    anzu
        94
    anzu  
       2020-08-03 17:52:47 +08:00   ❤️ 1
    怎么能花得这么好看,彩圈正好在指尖扩散
    deorth
        95
    deorth  
       2020-08-03 17:58:00 +08:00
    前段时间 SSD 突然掉盘,然后重启几次又进系统了。吓得我赶紧整了一个自动备份到 NAS 的计划任务。然而已经几个月没出问题了
    masker
        96
    masker  
       2020-08-03 18:44:00 +08:00 via Android
    买了一个浦科特的 ssd,512g 的,系统+大型游戏,gta5,战地 4,看门狗,cod16,大量读写,去年五月份组装的,至今没遇到任何问题
    secondwtq
        97
    secondwtq  
       2020-08-03 18:48:30 +08:00
    @whywhywhy 我用 ZFS,ZFS 是有文件系统级别的校验的,理论上好像是这样的:
    A 盘里有 文件甲.A + 校验码.A
    B 盘里有 文件甲.B + 校验码.B
    本来俩是一样的,现在假设 文件甲.B 坏掉了,文件系统查出 文件甲.B 和 校验码.B 不匹配,但是 文件甲.A 和 校验码.A 是匹配的,就会用 A 去覆盖 B
    两个同时坏掉就没辙了
    ivan_wl
        98
    ivan_wl  
       2020-08-03 19:11:59 +08:00
    我是做 ssd fw 研发工作,这种一般不会是存储介质问题,因为 nand 存储都会加 ecc 纠错码,如果 nand 上数据出错,fw 是可以知道的,并会报告给 host 的。
    这种情况我猜测可能是 fw bug 或其他问题导致的 ftl 映射表出错,楼主可以看看错误的数据是不是都以 4kb 为单元。
    另外,没人求壁纸吗,那我求一个~
    ltq918
        99
    ltq918  
       2020-08-03 19:15:15 +08:00
    U 盘和机械硬盘都遇到过,好像是寿命到了,不断地随机出现损坏的文件,这应该不是固态硬盘独有的问题
    ivan_wl
        100
    ivan_wl  
       2020-08-03 19:16:31 +08:00
    此外可以试试把盘上电放上一个晚上,如果是 fw 能检测到的错误,一般都会做全盘扫描尝试恢复,楼主也可以找一找你的 ssd 品牌,有没有提供工具箱软件
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1410 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 17:05 · PVG 01:05 · LAX 09:05 · JFK 12:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.