wwhc's recent timeline updates
wwhc

wwhc

V2EX member #145809, joined on 2015-11-05 06:54:06 +08:00
Today's activity rank 10215
wwhc's recent replies
5 days ago
Replied to a topic by plko345 Windows windows 终将成为最好的 Linux
微软的前途在于把 Windows 变成 Linux 的发行版之一
9 days ago
Replied to a topic by SilenceLL 硬件 站里没人看老黄的新电脑吗
如果不提供对 Linux 的良好支持 这个体系在 AI 领域并不具备竞争性
RX9070 对标 Nvidia Titan V 的 AI 推理性能
llama.cpp 的优化参数也很多,绝对性能目前可能仍不及 vllm 强,但可用性、易用性、可调性及部署能力都远强于 vllm
7900xtx 在 llama.cpp 下支持良好,推理时的预填充速度可能只比 4060ti 稍强,但 token 生成速度与 3090ti 相差不大
除非你是在为大公司或企业开发 AI 推理系统,建议使用 llama.cpp ,这是目前最好的 AI 推理框架
重度运行本地大模型的 Mac 要选用 M? Ultra ,即使是 M1 Ultra ,也强于任何世代的 Max 型号
@Jiajin
@junwind
不依赖别的工具,本地部署的 Qwen3.6 27B/35B 也能达到 GLM 的水准当使用“帮我生成一个天气查询 H5 应用”这个提示词
楼主的测试有偏差,本地部署的 Qwen3.6 27B/35B 使用楼主的提示词都能生成达到楼主图中 GLM 的水准的代码渲染,本地部署的 gpt-oss 120B 倒真是惨不忍睹,生成的的代码渲染出的页面没法看
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5483 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 07:18 · PVG 15:18 · LAX 00:18 · JFK 03:18
♥ Do have faith in what you're doing.