V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
camus
V2EX  ›  云计算

aws 上 GPU 计算实例跑 C4D 渲染比本地笔记本速度还慢,何解?

  •  
  •   camus · 2018-04-09 01:28:00 +08:00 · 6355 次点击
    这是一个创建于 2422 天前的主题,其中的信息可能已经有所发展或是发生改变。

    公司有项目要跑渲染,嫌本地算力不够就想试试 aws 上的 GPU 加速计算实例

    但是很诡异的是,用 Windows Server 系统,无论 G3、P2、P3 实例,C4D 最后出渲染的时候还不如笔记本的 i7 4 核低压 U+集显速度快,本地渲染 1 帧只需要 5 秒,

    在 g3.4xlarge,1 个 GPU,16 个 vCPU (按照官网规格 Intel Xeon E5-2686 v4 ),122GB 内存上平均也需要 30 秒才能出图

    而在 p2.8xlarge 上,32 个 vCPU,488GB 内存,照道理比 g3 多了一倍的核心数,比本地多 24 个 vCPU 下,竟然和 g3 的实例渲染速度不相上下

    C4D 就用的标准渲染器,完全无法理解是为何,感觉就算是没有 GPU 做加速,这么多核心在那算也不至于差距如此巨大

    不知道有没有同学可以帮忙解释下什么原因?不然只能去找渲染农场了

    16 条回复    2018-04-11 09:55:39 +08:00
    Livid
        1
    Livid  
    MOD
       2018-04-09 01:40:00 +08:00
    Paperspace 上可以按小时租用 V100:

    https://www.paperspace.com/pricing

    很好奇如果你们的渲染在上面跑会是什么效率。
    camus
        2
    camus  
    OP
       2018-04-09 02:01:59 +08:00
    @Livid #1 很小的项目,
    1080P50 还能忍忍,4K 算过一次将近 3 分钟每帧不能忍,才想到用用云主机,完全没法理解怎么会有这种差距
    paulx3
        3
    paulx3  
       2018-04-09 02:44:59 +08:00
    有没有可能是 GPU 驱动没设置好?全走的 CPU 渲染?
    evlos
        4
    evlos  
       2018-04-09 03:06:15 +08:00
    C4D 除了自带一个超烂的 GPU 渲染器以外,其他的自带渲染器都不支持 GPU 啊
    evlos
        5
    evlos  
       2018-04-09 03:07:59 +08:00
    我记得 C4D 支持集群渲染的啊,不行你开几百台机器
    laxenade
        6
    laxenade  
       2018-04-09 07:44:06 +08:00
    感觉压根没有用 GPU 在跑,而且用 CPU 跑的时候指令集说不定用的也不对?
    robertlyc
        7
    robertlyc  
       2018-04-09 07:56:19 +08:00
    惊现小王子
    imstand
        8
    imstand  
       2018-04-09 08:24:17 +08:00
    @camus @Livid 目测  Google 家的 Zync 最合适,https://www.zyncrender.com/
    327beckham
        9
    327beckham  
       2018-04-09 10:05:11 +08:00
    虽然我不知道 c4d 是个啥,不过建议反复做同样的实验,可以关注例如:内存使用情况,cpu 使用情况,显卡使用情况,磁盘 IO,网络吞吐等等方面,任何一方面都可能造成瓶颈(内存吃光,cpu100%,显卡驱动版本较低,5400 转的磁盘)
    fredcc
        10
    fredcc  
       2018-04-09 10:07:08 +08:00
    都租这个成本的实例了,直接 call aws support 帮你看啦
    st2udio
        11
    st2udio  
       2018-04-09 10:59:48 +08:00
    G 和 P,我记得一个是渲染型一个是计算型吧。渲染型做渲染比计算型做渲染效率更高
    camus
        12
    camus  
    OP
       2018-04-09 11:12:45 +08:00
    @paulx3 #3
    @evlos #4
    @laxenade #6
    就是用的 C4D 自带的标准渲染,跑 CPU,原本想速度不够用核心堆上去,没想到还不如笔记本快,而且笔记本还是核显,本地跑也是 CPU 满载

    @fredcc #10
    Spot Instance,哪里便宜走哪里…… Basic Support 貌似不会理睬吧

    @st2udio #11
    P 是计算,G 是渲染,训练用的都是 p 系列 Linux 实例没什么问题。
    G 用的 GRID 显卡,可惜现在还没解决这个问题,没体验到
    laxenade
        13
    laxenade  
       2018-04-09 13:02:33 +08:00
    @camus #12 你要堆 CPU 的话不应该走 c4 c5 吗 p 和 g 又帮不了你
    letsmotion
        14
    letsmotion  
       2018-04-09 14:07:33 +08:00
    Octane Render 路过~
    evlos
        15
    evlos  
       2018-04-09 19:50:20 +08:00
    @letsmotion #14 Octane Render 赞!
    MKDJOJO
        16
    MKDJOJO  
       2018-04-11 09:55:39 +08:00
    找专业农场吧,这个可能没有做驱动优化
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1177 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 18:00 · PVG 02:00 · LAX 10:00 · JFK 13:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.