V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
KasuganoSoras
V2EX  ›  NVIDIA

N 卡频繁出现 GPU 设备实例已经暂停

  •  
  •   KasuganoSoras · 2020-07-23 04:19:34 +08:00 · 8890 次点击
    这是一个创建于 1618 天前的主题,其中的信息可能已经有所发展或是发生改变。

    RTX 2080 Ti FE 公版,这个问题貌似是最近几天才开始出现的,有时候玩着游戏或者单纯刷刷网页都会突然黑屏,几秒钟之后恢复正常,而 3D 游戏之类的会直接崩溃,然后提示 "GPU 设备实例已经暂停。使用 GetDeviceRemovedReason 以确定相应的措施",看网上说是驱动问题,更新到最新版驱动依然会这样,就在发帖前几分钟又黑了一次,这问题有人遇到过么?

    27 条回复    2020-09-02 16:57:07 +08:00
    KasuganoSoras
        1
    KasuganoSoras  
    OP
       2020-07-23 04:49:34 +08:00
    补充一下,最近唯一对硬件做出的改动就是加了两条内存,从原来的 16G 加到 32G,除此之外没有做过其他改动,不知是否和内存有关系
    Mac
        2
    Mac  
       2020-07-23 05:40:59 +08:00 via Android
    用清洁安装重新安装驱动试试呢
    nvkou
        3
    nvkou  
       2020-07-23 05:56:10 +08:00 via Android
    接触不良?供电不足?
    leimao
        4
    leimao  
       2020-07-23 06:20:04 +08:00
    我也是公版,最新驱动,貌似没有这问题诶。
    vtea
        5
    vtea  
       2020-07-23 06:29:24 +08:00 via Android
    这应该就是传说中的掉驱动,之前我那 960 也是这样,结果过了一年 gpu 核心烧了
    arfaWong
        6
    arfaWong  
       2020-07-23 06:34:09 +08:00 via Android
    A 卡也出现类似的情况,坏了两条 DP 线了
    kokutou
        7
    kokutou  
       2020-07-23 07:09:35 +08:00 via Android
    @KasuganoSoras 内存拔掉不就知道了。。。
    内存不稳定也是有可能导致 n 卡驱动崩溃的,很少见
    crclz
        8
    crclz  
       2020-07-23 08:35:45 +08:00
    别更新到最新驱动。更新到 2 个月前的稳定版( WHQL )驱动
    pusheax
        9
    pusheax  
       2020-07-23 09:09:39 +08:00
    也有可能是硬件问题。核心虚焊之类的也会造成掉驱动。实在不行就申请售后吧
    ragnaroks
        10
    ragnaroks  
       2020-07-23 09:35:24 +08:00
    内存不稳定确实会导致显卡掉驱动,我拉到 4600mhz 后基本没多久就必现,先用内存测试工具跑下

    如果排除内存问题,那大多数情况下就是显卡本身有问题,而不是显卡驱动有问题
    ohao
        11
    ohao  
       2020-07-23 09:41:57 +08:00
    可能原因
    1 供电不足 /不稳
    2 驱动 bug
    3 内存冲突
    zlowly
        12
    zlowly  
       2020-07-23 10:13:21 +08:00
    如果是 N 卡新驱动 451.48 ,这个版本是有严重 bug,我玩的某个游戏会经常性卡画面几秒,回滚驱动到前一个版本后正常。
    hard2reg
        13
    hard2reg  
       2020-07-23 10:15:30 +08:00
    话说我昨天更新 nvidia studio 驱动直接黑屏了。。。。还好重启后显示正常。。。
    l33ch
        14
    l33ch  
       2020-07-23 10:17:55 +08:00 via iPhone
    AMD 平台? 4 条内存插满?
    laminux29
        15
    laminux29  
       2020-07-23 11:48:17 +08:00
    我同事以前也喜欢设备追新,甚至曾经配过全武汉最强家用机。后来他电脑平均半年出一次问题。

    然后我建议他换淘宝网吧二手件后,他就一直没拆过机箱。
    leimao
        16
    leimao  
       2020-07-23 12:16:12 +08:00
    看了看水友们的发言。的确,玩游戏追新没啥必要。如果看到自己玩的那几款游戏得到了特别的优化,那就可以考虑升级。不然可以不升级。
    jeeyong
        17
    jeeyong  
       2020-07-23 14:15:26 +08:00
    最新的 451.87 显卡驱动有类似的问题...445.78 貌似好了 小版本号可能记得不准确.
    KasuganoSoras
        18
    KasuganoSoras  
    OP
       2020-07-23 14:44:18 +08:00
    @jeeyong #17 目前版本是 451.67 ,在事件查看器里面看到崩溃时有警告 “显示器驱动程序 nvlddmkm 已停止响应,并且已成功恢复。” 看到网上有个玄学解决办法是在控制面板,启用 Windows 功能那里把 .Net framework 3.5 勾上,目前挂机了一晚上暂时未发现有崩溃问题,再观察一段时间看看。
    Reficul
        19
    Reficul  
       2020-07-23 15:33:33 +08:00
    @arfaWong DP 线会因为这个原因坏掉咩?
    Accelerant
        20
    Accelerant  
       2020-07-23 16:15:33 +08:00
    一种可能是要归西的前兆,实际上超频的时候常常能碰见掉驱动黑屏 Reset 的情况,是硬件的不稳定导致的驱动重置;尝试找多一个平台排除法测试一下,同时也拔掉新加的内存试试看。NV 现在一般推的自动驱动更新都是 WHQL 的,建议先尝试硬件排除,如硬件没有问题再去尝试回滚旧驱动 /重装 OS 等一类玄学根治方法解决。说来 FE 版本本身似乎不太好保修?加上现在是疫情期间。
    Accelerant
        21
    Accelerant  
       2020-07-23 16:18:19 +08:00
    可以试试用超频工具降频,不太清楚 RTX 20 series 能不能降频。如果不能,则用 nvidia-smi 降低 TDP 到最低试试看,如果可以稳定下来,说明真得保修试试看了。
    KasuganoSoras
        22
    KasuganoSoras  
    OP
       2020-07-23 17:15:29 +08:00
    @Accelerant #20 如果还是会黑的话我试试降频吧,目前我没超过频,因为散热不行,满载的时候温度都上 80,不敢超
    jeeyong
        23
    jeeyong  
       2020-07-23 20:20:55 +08:00
    @KasuganoSoras 居然还有这一说.....感谢分享!
    另外我再补充一个遇到的特别经历..
    我是 1080 的显卡, 安装了 Nvidia RTX Voice, 通过修改 xml 配置文件强制安装的.
    也会导致莫名其妙卡顿, 或者重启....
    不知道 RTX 系列显卡如何.
    不过降噪效果是真 NB.
    LiSkyAir
        24
    LiSkyAir  
       2020-07-23 20:30:15 +08:00
    @KasuganoSoras 可以试试把驱动更新为 NVIDIA Studio Driver 试试,这个最新版本是 451.77
    KasuganoSoras
        25
    KasuganoSoras  
    OP
       2020-07-23 23:33:55 +08:00
    @LiSkyAir #24 坏消息,几分钟前再次黑屏,貌似就是出现在频繁切换 3D 游戏窗口以后才会出现,看来我可能需要尝试下降频或者联系保修了
    745839
        26
    745839  
       2020-07-24 09:32:47 +08:00
    遇到过,当时一直没有解决,凑合着用,直到有一天,花屏了
    XXOO133
        27
    XXOO133  
       2020-09-02 16:57:07 +08:00
    我遇到过类似问题,就是开机黑屏,有时候开得起有时候开不起,看日志也是"GPU 设备实例已经暂停找了很久原因,还送了售后,‘最后发现是主板显卡插槽有个触点歪了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5543 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 61ms · UTC 06:52 · PVG 14:52 · LAX 22:52 · JFK 01:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.