求可靠本地 vibe coding，有八卡的 L20 服务器

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

有一台八卡 llgpu 服务器，想搞一个本地 AI 编码，求可靠方案

编码

服务器

2 条回复

coefu

2 小时 45 分钟前

unsloth/Qwen3.5-397B-A17B-GGUF, UD-Q6_K,327G,留 50G 跑 context ，看情况；如果 context 不够，就换 UD-Q4_K_XL ，245G ，留 130G 跑 context ，肯定够的。

IDE 用开源的 continue 即可。想完全 agent ，估计够呛，你自己得盯着。local 的能力肯定不如云端 api 的。

coefu

2 小时 43 分钟前

先试 llama.cpp 的 8 卡 tensor parallel 。反正一年前的 8 卡 TP 模式，是有点问题的，不知道修复没有。如果不行，就上 vllm 。