V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
canteon
0.04D
V2EX  ›  Amazon Web Services

aws 服务挂掉了,弗吉尼亚区

  •  1
     
  •   canteon · 21 天前 · 7990 次点击
    第 1 条附言  ·  21 天前
    已经恢复了,用 chatgpt 大概总结下,时间已经换成北京时间。跟实际遇到的一样,先是 krio 直接坏了,发现是弗吉尼亚区,同时 aws ,DynamoDB 崩溃,ses 崩溃, 中间其实应该还有 cloudfront 控制台无法访问。

    在 10 月 20 日下午 2:49 到 10 月 20 日下午 5:24 (北京时间) 之间,
    AWS 在 美国东部( US-EAST-1 )区域 出现了 错误率上升和延迟增加 的问题。

    依赖该区域端点的服务(如 IAM 、DynamoDB Global Tables )也受到了影响。

    在 下午 3:26 ,AWS 确认故障原因是 DynamoDB 区域服务的 DNS 解析问题。
    在 下午 5:24 解决 DNS 问题后,服务开始恢复,但 EC2 实例启动系统 因依赖 DynamoDB 而继续受影响。

    随后,网络负载均衡器( NLB )健康检查 也受到波及,导致 Lambda 、DynamoDB 、CloudWatch 等多项服务的 网络连接出现问题。

    在 10 月 21 日凌晨 12:38 ,网络负载均衡器健康检查恢复。
    AWS 在恢复期间 暂时限制( throttle ) 了部分操作(如 EC2 启动、SQS 队列触发的 Lambda 执行、异步 Lambda 调用),并逐步解除限制。

    最终在 10 月 21 日早上 6:01 ,所有 AWS 服务完全恢复正常。
    不过,AWS Config 、Redshift 、Connect 等部分服务仍有 消息积压,预计将在接下来数小时内处理完毕。

    AWS 官方将稍后发布该事件的详细总结报告。
    79 条回复    2025-10-21 17:42:45 +08:00
    ShuaiGeLiu
        1
    ShuaiGeLiu  
       21 天前
    是的,亚马逊商城都有几率刷不出来产品。
    ChevalierLxc
        2
    ChevalierLxc  
       21 天前
    好像是影响全球业务了,很多 region 都挂了,不仅仅是 ue1
    canteon
        3
    canteon  
    OP
       21 天前
    @ShuaiGeLiu 云服务挂掉了,cloudfront 打不开
    qiyuey
        5
    qiyuey  
       21 天前
    npm 503 和这个有关吗?
    lxdlam
        6
    lxdlam  
       21 天前   ❤️ 5
    AWS 核心控制面在 us-east-1 ,业务在 us-east-1 的受影响,业务不在 us-east-1 的也受影响,太精彩了
    burnsby
        7
    burnsby  
       21 天前
    claude 官网都使用不了了
    xooass
        8
    xooass  
       21 天前
    我还以为我的亚马逊 SPAPI 账号被封了... apikey 更新不了
    Uplay
        9
    Uplay  
       21 天前
    亚马逊直接登录不上去了
    kingfire
        10
    kingfire  
       21 天前
    cursor 也挂了,打不开 dashboard 了
    pingdog
        11
    pingdog  
       21 天前 via Android
    估计升级某个组件后雪崩效应,等回退
    aws 上次也是
    liqingyou2093
        12
    liqingyou2093  
       21 天前
    刚配置了 cloudfront, 有毒吧
    qiaobeier
        13
    qiaobeier  
       21 天前
    我司也是,Prod 用了 AWS SQS ,挂逼了。连 Git 服务都挂,白瞎收那么多钱。
    burby
        14
    burby  
       21 天前
    我们运维说整个美东都受影响了....
    dream10201
        15
    dream10201  
       21 天前
    hub.docker.com 也崩了
    2962051004
        16
    2962051004  
       21 天前
    npmjs 也挂了
    netnr
        17
    netnr  
       21 天前
    vercel 也受影响了?状态页有错误事件
    HK560
        18
    HK560  
       21 天前
    我就说特么怎么死活拉不了镜像
    sometime
        19
    sometime  
       21 天前
    fan123199
        20
    fan123199  
       21 天前
    我们好几个网页都挂了,因为 vercel 也在上面-_-
    szdubinbin
        21
    szdubinbin  
       21 天前   ❤️ 3
    postman 也 G 了,还在用的千万不要手贱啊 ,同事发现 postman 上接口全空了吓得尿都出来。
    tinybug
        22
    tinybug  
       21 天前   ❤️ 1
    onlyfans 也 load 不出来了
    miken2234
        23
    miken2234  
       21 天前
    poe 也挂了
    szdubinbin
        24
    szdubinbin  
       21 天前
    @tinybug ???
    v2306
        25
    v2306  
       21 天前
    @tinybug 666
    sunnygaofan
        26
    sunnygaofan  
       21 天前
    影响范围还挺广的,一堆在用的挂了 postman, vercel,npm,docker 卧槽,不是只是一个可用区挂了吗
    canteon
        27
    canteon  
    OP
       21 天前
    @sunnygaofan 6 楼说了真实情况,他今天就更新这个区
    10240
        28
    10240  
       21 天前
    perplexity 扑街中
    NeoMatrix
        29
    NeoMatrix  
       21 天前
    挺多 app 受影响的,估计股价要跌了。
    Mi1kTea
        30
    Mi1kTea  
       21 天前
    业务在 GCP 上,但是镜像是 dockerhub ,结果 aws 挂了,镜像拉不了了,悲催
    Smilencer
        31
    Smilencer  
       21 天前
    东大笑了
    liuliuliuliu
        32
    liuliuliuliu  
    PRO
       21 天前
    利好微软 Azure ?现在买微软股票还来得及吗?
    rm0gang0rf
        33
    rm0gang0rf  
       21 天前
    系统没瘫, 附加服务全瘫了, 下班
    mytsing520
        34
    mytsing520  
    PRO
       21 天前
    epicGames 扑街中
    messyidea
        35
    messyidea  
       21 天前
    postman 也挂了
    nanjoyoshino
        36
    nanjoyoshino  
       21 天前
    cursor 补全没了,还以为是梯子问题,浪费我排查半天
    sheepyoung
        37
    sheepyoung  
       21 天前   ❤️ 1
    supercell 游戏全挂了
    loveshuyuan
        38
    loveshuyuan  
       21 天前
    jira 也挂了
    Moishine
        39
    Moishine  
       21 天前 via iPhone
    已经中招😂
    JayShen
        40
    JayShen  
       21 天前   ❤️ 1
    中招了。。。会不会是 vibe coding 出 bug 了 哈哈
    cat9life
        41
    cat9life  
       21 天前
    刚看到这个帖子.. 浪费了好长时间 😂
    tomzhang
        42
    tomzhang  
       21 天前
    dockerhub 也崩了
    jaysonmac
        43
    jaysonmac  
       21 天前
    各种服务都挂了,只能说 aws 牛逼😂
    sugars
        44
    sugars  
    PRO
       21 天前
    难怪我的 postman workspace 和 environments 全空了,吓死我了啊
    craftsmanship
        45
    craftsmanship  
       21 天前 via Android
    十分精彩🤓
    fkdtz
        46
    fkdtz  
       21 天前
    整个晋西北都乱成一锅粥了
    🍚
    chenqh
        47
    chenqh  
       21 天前
    aws 挂了?azure 和谷歌云怎么没挂?不是多云架构的吗?
    liuxh7
        48
    liuxh7  
       21 天前
    alexa app 也挂了,我说测试怎么测不了
    albertofwb
        49
    albertofwb  
       21 天前
    tmd 我就说 怎么我的 .github ci docker build 总是失败 ....
    Randomjo
        50
    Randomjo  
       21 天前
    上周五我用 vercel 试一下部署个小网页,今天再部就不行了。我想半天搞好久都不知道发生什么事情了。
    tmd 的结果是 aws 寄了
    m1nm13
        51
    m1nm13  
       21 天前
    docker hub 炸飞了
    canteon
        52
    canteon  
    OP
       21 天前
    @chenqh 看 6 楼,现在已经知道的 cloudfront 已经恢复了。DynamoDB 还在死机中
    abcdecsf
        53
    abcdecsf  
       21 天前
    @nanjoyoshino 我就说。。。
    Rickkkkkkk
        54
    Rickkkkkkk  
       21 天前
    典型的业务隔离,但依赖没隔离。
    sugars
        55
    sugars  
    PRO
       21 天前
    postman 已恢复正常
    dingjs
        56
    dingjs  
       21 天前
    biubiuF
        57
    biubiuF  
       21 天前 via iPhone
    临着下班 dynamodb 服务恢复了,日了狗
    canteon
        58
    canteon  
    OP
       21 天前
    @biubiuF 没事 还有 ses 还在恢复呢
    michael2016
        59
    michael2016  
       21 天前
    美东承载了大半个互联网,赔钱吧
    hoythan
        60
    hoythan  
       21 天前
    希望下班之前 Docker 不要恢复
    sjdhome
        61
    sjdhome  
       21 天前
    Slack 也 [受影响]( https://slack-status.com/) 了
    iugo
        62
    iugo  
       21 天前
    Miao18
        63
    Miao18  
       21 天前
    坏消息:在下班前慢慢恢复了。
    好消息:没法干活,提前走了。
    shitcode
        64
    shitcode  
       21 天前
    @sugars 没有吧,workspaces 还是刷不出
    hoythan
        65
    hoythan  
       21 天前   ❤️ 1
    @hoythan 妈的下班最后 20 分钟恢复了
    fuchaofather
        66
    fuchaofather  
       21 天前
    @tinybug bro ,现在呢,很急
    savingrun
        67
    savingrun  
       21 天前
    postman GG 了
    11000111010
        68
    11000111010  
       21 天前
    听说是慢慢恢复了 https://imgur.com/a/DDVpi72
    11000111010
        69
    11000111010  
       21 天前
    听说是慢慢恢复了 这次的后果会是什么呢?
    https://imgur.com/a/DDVpi72
    coldle
        70
    coldle  
       21 天前
    真就行行业业都得抖三抖 🤣
    justdoit123
        71
    justdoit123  
       21 天前
    ebs 还是有问题,k8s pv/pvc/pod 会出现卡死的状态,绑定关系也无法真正解除。nnd
    dingdangnao
        72
    dingdangnao  
       21 天前
    iCloud 和 iTunes 服务好像也崩了😂
    yingqi1
        73
    yingqi1  
       21 天前
    ec2 到现在也没恢复,服了,下游 kes 也是
    ltltfuture
        74
    ltltfuture  
       21 天前
    看看这回要赔多少了
    xiaket
        75
    xiaket  
       21 天前
    昨天 zoom 里面 AWS 的 TAM 说是 dynamoDB 的 frontend 有问题. 所以级联导致了很多其他服务有问题(比如 EKS)
    kingcanfish
        76
    kingcanfish  
       21 天前
    接下来就是等 aws 的事故报告了
    jojobalabala
        77
    jojobalabala  
       20 天前
    west 有影响吗? 服务器莫名其妙脱域了,其他到没影响,理论上不受关联,但这时间节点那么巧呢
    canteon
        78
    canteon  
    OP
       20 天前
    @jojobalabala aws 好多服务最基础都跟这个区有关系,cloudfront iam vpc ,因为最早就只有这一个区,后面才开始有 region 的概念。但是吧看起来他们并没有区分,99.9999 的稳定性被打破了
    Binlabs
        79
    Binlabs  
       20 天前
    草台班子
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3326 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 04:56 · PVG 12:56 · LAX 20:56 · JFK 23:56
    ♥ Do have faith in what you're doing.