cs8425

cs8425

V2EX member #240548, joined on 2017-07-16 00:29:06 +08:00
Today's activity rank 10994
Per cs8425's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
cs8425's recent replies
1 day ago
Replied to a topic by davidyin Local LLM 想折腾一个 AI 主机,请行家出手
刚好手上有 4070S 跟 9060xt, 最近也在尝试这块
先说结论:
12G 显存完全不够用
16G 也只是勉强能动
拿去辅助编程不是智商太低就是速度太慢
要嘛买更好的卡, 不嘛就 api 算了

我只测了 gemma-4-E2B Q4 、gemma-4-E4B Q4 跟 gemma-4-26B Q4 (MoE 类型)
4070S 跑 E4B 没啥问题, 速度大概 90t/s, 26B 就完全不行了
9060xt 跑 E4B 大概 60t/s, 26B 能动但最高只有 20t/s 通常在 15~19 之间
用的是 llama.cpp, backend vulkan
E4B 辅助编程错误很多, 要一直叫他修正
26B 错误是少很多, 勉强算堪用吧, 但运行太慢, 结果最后总花费时间跟 E4B 多轮差不多....
虽然不排除目前对 gemma 4 系列的支持不是很好/有 bug 就是了

跑 SDXL 的话
4070S 速度大概是 9060xt 的 1.7~2 倍 (1536x1024 一个 45 秒一个 80 秒)
但解析度/模型大一些就先炸了
@cnevil #16
@HFX3389 #21
也有可能是上下文的问题
我用 gemma 4 E4B Q4_K_M 完全离线的情况来说
只丢 poc 的 code 总结出来就类似 @andlp #10
https://xint.io/blog/copy-fail-linux-distributions 内 "The Root Cause: Page Cache Pages in the Writable Scatterlist"到"The Exploit"这几段乱的内容+poc code 丢进去
总结出来的就是正确的:
执行: 所有 Shellcode 片段都被写入后,g.system("su") 执行。由于 /usr/bin/su 的 Page Cache 已经被 Shellcode 覆写,当 su 被载入执行时,它会执行攻击者植入的代码,并以 root 权限运行。
lightpanda 虽然不是给人用的(狗头
Mar 30
Replied to a topic by Drliehuo Windows windows 11 现在问题还多吗
25H2 小问题非常多
甚至不如 linux 桌面日常用还比较稳定
举个最近才碰到的 bug
切换成中文要等 3 秒
切换按下去到反应过来中间打的也会一并出现
但是必须在 3 秒后才跳出来
Dec 30, 2025
Replied to a topic by weiwenhao 程序员 Nature vs Golang: 性能基准测试
@weiwenhao #89 #90 会这么问估计是因为 golang 现在是 1.25 而 1.23 已经是 unsupported 的版本...
Dec 22, 2025
Replied to a topic by equator 云计算 请教如何实现 KVM 虚拟机共享内存
有没有一种可能
实体机先用 kvm 虚拟化一个 VM VM 内再用容器之类的技术租给使用者?
不是直接 kvm 的 vm 租出去
也不是实体机上面直接开容器组出去
@fpure @xxxccc
啊? 没有吗?
我看目录有写"08: 索引: 完整版章节"、"09: 事务与并发: 完整版章节"
想说应该有准备买下去了说...
"我要求不高,就做个 get 循环读取的桌面小摆件,这点 micropython 肯定能胜任吧。"
是能胜任没错 但基本底子也要够才行
简单点自己照 datasheet 呼叫 i2c spi 就能搞定
复杂点要动 script engine 的 code 加自己需要的功能(还会因为​​底层 MCU 不同而不同)
对硬件不熟就别选这种高阶语言封装+没有适配零件的组合
新手小白就照上面老哥们提到的
乖乖选 arduino 那种最多人用的拿 example 直接改

相关: n 年前用 nodemcu(esp8266+lua)开发过, 要连接没有人适配过的外设, 自己 fork 一份加/改一些 c code
Sep 25, 2025
Replied to a topic by liyafe1997 PostgreSQL 用 PostgreSQL 存图片等 binary 有什么坑吗
GIS 相关+1 @sagnitude #35 是正解
小碎档太多了, 不是塞 db 就是塞 zip 这类的东西聚合成较大的档案来储存跟交换
尤其是 3D 相关的, 一个图层只包含小小一个区域随便就 700 多 M(700 多 x 百万)个档案, 至少我司这边的资料大多都是
一般常用 WMTS 图砖也不少, 能算出多少数量
例如 level 8 这层, 全球范围就是 4^8 = 65536 个档案
然后一般提供的 level 都是 0 到 18~22 左右
也就是 4^0 + 4^1 + 4^2 +....+4^22 个档案...
各位可以自行算一下(狗头
Sep 15, 2025
Replied to a topic by moverinfo 推广 timystruct 前世今生(2)
对于小任务小工具
更纳闷的是为何要用 java?
用更适合的语言跟工具不是更好?
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3268 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 13:08 · PVG 21:08 · LAX 06:08 · JFK 09:08
♥ Do have faith in what you're doing.