V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
shuigui
V2EX  ›  程序员

调查一下,各位在实际生产中有用爱国者 arm 服务器吗(某山系列~)?

  •  
  •   shuigui · 2020-07-07 12:06:39 +08:00 · 6380 次点击
    这是一个创建于 1632 天前的主题,其中的信息可能已经有所发展或是发生改变。
    • 你们有遇到什么奇怪的问题吗?
    • 我遇到了一些问题,按理是先要排查自身原因的,但在 x86 上都是正常的,如何说服相关人员放弃 arm 服务器?
    • 个人观点:主动当小白鼠的都是 sx,吹水的宣传让不懂技术的相关人员对所谓的“国产服务器”更安全,还有所谓的欧拉操作系统(手动狗头保命)
    第 1 条附言  ·  2020-07-08 11:49:30 +08:00
    问题找到了,华为的老运维远程协助了下,好了
    第 2 条附言  ·  2020-07-08 11:55:13 +08:00
    确实是自己问题,无脑黑;
    66 条回复    2020-07-10 09:56:23 +08:00
    whileFalse
        1
    whileFalse  
       2020-07-07 12:19:12 +08:00   ❤️ 6
    x86 正常 arm 不正常很奇怪吗?

    要说爱国 arm 服务器有问题,你先得证明你的业务在知名品牌 arm 服务器、centos7 下能正常工作,但在基于爱国 arm 、基于 centos7 的欧拉系统下不能正常工作。

    另外,不懂技术的人听人吹牛逼就强上 arm 确实是傻屌……(除非贵司是涉及国家安全的部门
    nightwitch
        2
    nightwitch  
       2020-07-07 12:32:06 +08:00
    #1 +1 先在 arm Debian 上跑一下看看,是不是正常的,不是正常的说明代码在 arm 环境下需要修改呗。Travis-CI 提供 arm 的 CI 环境,可以丢上去跑一下单元测试。
    echo1937
        3
    echo1937  
       2020-07-07 12:34:52 +08:00
    看不出来到底是设备不行,还是使用者自身有问题,

    就算在 x86 平台,也经常遇到开发环境很 OK,到了线上就不行了的情况,

    选解决方案的时候,团队能否驾驭是要首先考虑的问题,不管这个新平台是更强还是更弱。
    polaa
        4
    polaa  
       2020-07-07 12:45:02 +08:00
    泰山么

    我系统还没装
    sorry
        5
    sorry  
       2020-07-07 13:24:40 +08:00   ❤️ 2
    公司当小白鼠或许是 lz 说的那样,但是技术人员第一波绝对不是小白鼠,有机会吃技术红利,国产化是大趋势
    wangkai123
        6
    wangkai123  
       2020-07-07 13:29:20 +08:00
    最近正好在迁移,没遇到什么问题,可以具体说说你遇到的坑?
    cshlxm
        7
    cshlxm  
       2020-07-07 13:30:00 +08:00
    奇怪的问题不多,主要是不少(很多)库找不到 2 进制版本,需要自己编译,整体用下来和 x86 比 只有便宜一个优点了。。。奇怪的问题我这里多数是代码里有平台特性的东西,这个基本上在编译阶段就发现了
    back0893
        8
    back0893  
       2020-07-07 13:47:45 +08:00
    反正是写上层应用
    目前在手机上写着玩,倒是么有兼容问题
    scukmh
        9
    scukmh  
       2020-07-07 13:52:39 +08:00
    再用某鹏系列。
    shuigui
        10
    shuigui  
    OP
       2020-07-07 14:16:51 +08:00   ❤️ 2
    @echo1937
    @wangkai123
    @nightwitch
    他们做性能测试时,一样的测试条件,网络流量冲上来后,x86 上软中断的对 cpu 的占用是负载均衡的,在 arm 上是到到达一个值后,就只跑在一个 cpu 上然后出现严重的丢包,从纸面配置看 arm 的 cpu 频率和核数比 x86 高;试过了主板开启什么性能模式,多网卡队列,中断亲和性,然并卵
    wangkai123
        11
    wangkai123  
       2020-07-07 14:24:19 +08:00   ❤️ 1
    @shuigui 看起来和硬件架构无关和操作系统有关
    ccav
        12
    ccav  
       2020-07-07 14:27:13 +08:00
    golang + debian + 华为鲲鹏 无任何问题。

    arm 应该便宜但不便宜。
    echo1937
        13
    echo1937  
       2020-07-07 14:36:14 +08:00
    @shuigui #10 这类问题,我在某些版本的 x86 Linux 系统下也遇到过,建议你咨询一下相关的操作系统厂商,大概率都能解决。
    taobibi
        14
    taobibi  
       2020-07-07 15:07:03 +08:00
    国产 ARM 服务器的部署我们业务也遇到了,最后我们返回总公司重新开发程序了。重新开发的费用自己公司背了。
    realpg
        15
    realpg  
       2020-07-07 15:34:34 +08:00   ❤️ 1
    一个字:贵

    性能,通用代码编译的大程序,多线程,cpu 轻度密集型应用,在 ubuntu 下,同频率同内存占用情况下,大约性能是 x64 的 1/6,centos 下大约 1/7

    服务器价格比 x64 还贵
    yulitian888
        16
    yulitian888  
       2020-07-07 15:40:58 +08:00
    诶,我司是造它们的。楼主这样诅咒我们的顾客,不太好吧!
    https://tech.china.com/article/20200521/20200521522274.html
    zjsxwc
        17
    zjsxwc  
       2020-07-07 15:45:42 +08:00
    Arm 服务器有什么好处?更省电吗
    dangyuluo
        18
    dangyuluo  
       2020-07-07 15:48:23 +08:00
    我们在用 AWS C6 系列 ARM 服务器
    geekvcn
        19
    geekvcn  
       2020-07-07 15:52:22 +08:00   ❤️ 1
    @zjsxwc 放国内就是“国产自主可控”,爱国 U,英国芯,arm 的好处实际上就是能效比,外加企业可以根据自身需求进行定制添加模块,修改处理器规模,不像 x86,只能选 Intel 和 AMD 的成品,缺点就是买授权,雇人定制,外加流片生产一套下来如果规模过小,单服务器成本均摊下来很高,所以基本都是大企业才玩得起
    wangkai123
        20
    wangkai123  
       2020-07-07 16:32:22 +08:00
    @realpg 测试的程序是?过程是?
    我们测 Taishan 920,貌似性能差距在 20%以内
    tabris17
        21
    tabris17  
       2020-07-07 16:35:02 +08:00
    arm 服务器的优势不应该是廉价嘛,如果比 x86 还贵,那还买个 XX 的 arm 服务器啊
    realpg
        22
    realpg  
       2020-07-07 16:39:36 +08:00
    @wangkai123 #20
    我这 916,920 这代手里没有
    基本上 复杂混合型应用 不是 CPU 密集,也不是完全 IO 密集那种,就是这个实测数据。
    都是自己的应用吞吐量和响应时间增加调测的 是密集线程的应用 CPU 持续平均负载 40-60%

    这边有详细的报告,然后确定用 916 的双路机器跑同样的内部应用,打到同样标准,需要 6 倍的物理机陪陪。
    realpg
        23
    realpg  
       2020-07-07 16:40:27 +08:00
    @tabris17 #21
    因为,买华为 ARM 的都是那种不差钱的单位。所以价格就贵。
    反正卖 1 万还是卖 11 万,都不会影响肯定卖。
    Judoon
        24
    Judoon  
       2020-07-07 16:41:55 +08:00
    上头给的政治压力需要配合兼容性测试,搞了两三回了,蛋疼得很
    nutting
        25
    nutting  
       2020-07-07 16:43:27 +08:00
    有种树莓派的感觉,听着就很恶心
    morphyhu
        26
    morphyhu  
       2020-07-07 16:49:04 +08:00
    ARM 的优势还是能耗低。兼容性肯定是 X86 更好一点。
    wangkai123
        27
    wangkai123  
       2020-07-07 17:05:04 +08:00
    @realpg 看来 916 和 920 性能差很多?
    KarPy
        28
    KarPy  
       2020-07-07 17:12:18 +08:00
    一圈国产服务器适配下来,kp 是最好的。。。

    龙芯、飞腾搞得我都快哭了
    XIVN1987
        29
    XIVN1987  
       2020-07-07 17:30:06 +08:00
    没想到,,竟然已经有这么多人用过 ARM 服务器了,,未来可期啊
    realpg
        30
    realpg  
       2020-07-07 17:36:41 +08:00
    @wangkai123 #27
    应该不单纯是 CPU 的问题

    这边的是多程序多语言集成业务 当然开发商也比较商业软件化性能不高

    一个处理流式信息 即时加工的业务流

    包含 C/C++ JAVA PYTHON 的多个程序 还有分布式的队列,分布式的缓存 各个节点对等

    最开始按照 1:2 配比,就是 X64 机器一台配账面性能等同的 ARM 两台 除了内存 因为华为 916 的 2U 机器内存插槽很少,那边是多条小容量,arm 这边是单条大容量凑够了相同的内存数,这个 1:2 的配比是华为那边的工程师建议的

    然后跑几天就发现这边的处理流不实时了 分布式队列引擎积压严重 这个实时性当时看不出来 但是跑几天就会越来越大

    最后多个部门、设计院、研究所进行一起联合多日调测跟踪,最后的结论就是,ubuntu 要六倍配机器,centos7 要七倍配机器,才能稳定良好运行。还进行了一些对比测试,单一程序密集 CPU 满载,以及那种不吃 CPU 的 IO 敏感程序但是不 IO 严重超载的程序,可能相对的影响要低,两倍就够。


    另外,多线程以及多个不同的应用的调度,会严重放大缺点,但是不会固定的体现,大概就是长时间跑着,就会出坑……

    centos 大概是受限于内核版本太低,导致没有 ubuntu 的性能好。
    XIVN1987
        31
    XIVN1987  
       2020-07-07 17:50:22 +08:00
    @realpg

    你们设计院、研究所联合调测跟踪多日,,就没得出点儿具体的结论??

    比如哪个库的哪个函数因为什么原因导致性能瓶颈??
    wangkai123
        32
    wangkai123  
       2020-07-07 17:51:48 +08:00
    @realpg 嗯,之后准备上实际业务测一测了,我们测的是 web 应用,可能就没有把缺陷体现出来
    stoneabc
        33
    stoneabc  
       2020-07-07 18:47:45 +08:00
    你这怎么就能确定是哪个厂商的 CPU 的问题呢…
    yushiwho
        34
    yushiwho  
       2020-07-07 18:50:38 +08:00 via Android
    泰山
    ipadpro4k
        35
    ipadpro4k  
       2020-07-07 18:56:15 +08:00 via iPhone
    @zjsxwc #17 主动交爱国智商税
    joesonw
        36
    joesonw  
       2020-07-07 19:21:50 +08:00
    还记得微公交那种小电车吗? 出厂价 11 万, 到手 2 万, 中间差价补贴. 这就是国产化.
    liangjx
        37
    liangjx  
       2020-07-07 19:32:49 +08:00
    只是以备不时之需吧,为何要放弃呢?慢慢调试啊
    gefranks
        38
    gefranks  
       2020-07-07 19:40:12 +08:00
    爱国是门生意,反正我不做这生意,更不想交税
    zjsxwc
        39
    zjsxwc  
       2020-07-07 19:51:06 +08:00 via Android
    @geekvcn #19 原文:“@zjsxwc 放国内就是“国产自主可控”,爱国 U,英国芯,arm 的好处实际上就是能效比,外加企业可以根据自身需求进行定制添加模块,修改处理器规模,不像 x86,只能选 Intel 和 AMD 的成品,缺点就是买授权,雇人定制,外加流片生产一套下来如果规模过小,单服务器成本均摊下来很高,所以基本都是大企业才玩得起”
    回复:



    有道理。

    不过国产的都不太行,那个国产 x86 的兆芯 cpu,也没什么起色。

    苹果已经敢把自家的 A 系列 arm cpu 用到 mac 上说明有实力的企业用 arm 也是可行。
    benmaowang
        40
    benmaowang  
       2020-07-07 20:48:21 +08:00
    @KarPy 怎么个哭法?我感觉我也快要踩坑了。。。
    liuxu
        41
    liuxu  
       2020-07-07 21:57:27 +08:00
    楼上的各位知不知道苹果要把 x86 换成 arm 了。。
    nosilence
        42
    nosilence  
       2020-07-07 22:19:00 +08:00   ❤️ 1
    我们的产品在 x86 和 kp 的 arm 上整体差距只有 5%~10%
    你这 6~8 倍的差距,建议向菊花反馈,应该会有人和你们对接看具体的问题
    Nadao
        43
    Nadao  
       2020-07-07 22:28:40 +08:00   ❤️ 1
    看来某天 US 不卖 CPU 给国内,还有 arm 可以撑一下。
    soji18
        44
    soji18  
       2020-07-07 22:33:55 +08:00 via Android
    @liuxu 苹果用的是指令集,又不是公版实现。
    wdlth
        45
    wdlth  
       2020-07-07 23:16:49 +08:00
    有用鲲鹏的
    kennylam777
        46
    kennylam777  
       2020-07-07 23:23:19 +08:00
    @liuxu 人家 Apple 就算是 ARM, 都有整套 kernel 由零開始的能力
    然而, 明明都是用的開源 Linux Kernel, 基本的 SMP 都調不好, 華為造了多年 BSP, 功力應該不錯的吧
    mengzhuo
        47
    mengzhuo  
       2020-07-07 23:34:54 +08:00 via iPhone
    一般是你的代码有问题
    我有台 thunder x2 跑了 2 年多了,没啥问题
    cdlnls
        48
    cdlnls  
       2020-07-07 23:37:38 +08:00 via Android
    有用过鲲鹏 920,具体服务器型号忘了,挺贵的好像。
    用下来基本没发现什么问题。
    印象比较深刻的就是那个服务器单个电源就 2000w 。
    redsonic
        49
    redsonic  
       2020-07-08 05:08:33 +08:00
    多核支持差,跑大型应用要折腾,跑起来以后突然发觉我 TM 原来 X86 跑的好好的,折腾这是图啥。如果单纯跑虚拟机、容器,绑定到单个小核上还划得来。 不过你看某鱼上成堆的 intel 多核加速卡,不难想象如果未来支持上不去那么过几年就能去某鱼淘到便宜的 256 core ARM“静音”服务器了。
    love
        50
    love  
       2020-07-08 06:39:24 +08:00 via Android   ❤️ 2
    人家苹果没事都要转 arm,这边有事让他转都要死要活的,差距咋这么大呢
    ghwolf007
        51
    ghwolf007  
       2020-07-08 08:22:35 +08:00
    客户用过 适配时还好有华为攻城狮支持 不然很多都搞不定。。。。
    stoneabc
        52
    stoneabc  
       2020-07-08 08:36:29 +08:00 via Android
    @kennylam777 毕竟 apple 转 arm 后,有坑也是开发者的问题嘛:)
    KarPy
        53
    KarPy  
       2020-07-08 11:26:12 +08:00
    @benmaowang 莫名其妙掉电、重启、服务卡死、系统崩溃。。
    shuigui
        54
    shuigui  
    OP
       2020-07-08 11:48:02 +08:00
    @KarPy 你这扯犊子吧
    guwenwu285
        55
    guwenwu285  
       2020-07-08 11:55:56 +08:00
    #10
    @shuigui 软中断只跑到一个 cpu 上的问题好熟悉,我遇到过。我遇到的是系统上装了个自动负载均衡软中断的包, 叫 irqbalance.service 啥的服务(具体名字忘记了),导致手动设置亲和性无效,可以尝试卸载这个包,然后再手动设置亲和性。
    Limius
        56
    Limius  
       2020-07-08 11:56:36 +08:00
    @gefranks 能让爱国的企业平时也少不了来自顶层的爱戴。
    大部分人还没到资格去爱国。
    shuigui
        57
    shuigui  
    OP
       2020-07-08 12:15:25 +08:00
    @love
    @liuxu
    烦请两位以后不要只看个新闻就完事了,你再仔细去了解一下华为 联发科、高通 三星、苹果是怎么去折腾 arm 的,3 家所做的事完全不是一个级别的,两位大佬
    shuigui
        58
    shuigui  
    OP
       2020-07-08 12:20:51 +08:00
    @guwenwu285 还是很感谢你的回复
    liuxu
        59
    liuxu  
       2020-07-08 13:54:16 +08:00
    @shuigui 我随口说一了句,你要不要把我吊起来审判一下
    flynaj
        60
    flynaj  
       2020-07-08 15:02:06 +08:00 via Android
    arm 那种性只能当玩具,真实服务器要求的高性能一定都没有。
    KarPy
        61
    KarPy  
       2020-07-08 15:40:31 +08:00
    @shuigui 哪块扯犊子了?
    julyclyde
        62
    julyclyde  
       2020-07-08 15:48:39 +08:00
    我还以为是指爱国者牌子呢
    心想这厂不是生产 mp3 的么
    429839446
        63
    429839446  
       2020-07-09 09:59:41 +08:00
    @flynaj 开玩笑,如果你不显交叉编译麻烦,你可以用 arm 做编译机,写 x86 的应用。编译速度吊打少核心的 intel 。
    flynaj
        64
    flynaj  
       2020-07-09 12:15:26 +08:00
    @429839446 #63 你发个 openssl speed 的测试图我看看到底快多少!
    429839446
        65
    429839446  
       2020-07-10 09:51:56 +08:00 via Android
    @flynaj 呵呵,你以为 arm 没有 rsa 硬件加速?
    429839446
        66
    429839446  
       2020-07-10 09:56:23 +08:00 via Android
    @flynaj 再提一句,华为的片上是有 zlib 硬件加速的,只要开个证书就可以用。intel 还要单独购买 pcie 卡。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1032 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 20:17 · PVG 04:17 · LAX 12:17 · JFK 15:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.