V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  rmrf  ›  全部回复第 1 页 / 共 6 页
回复总数  103
1  2  3  4  5  6  
2 月 26 日
回复了 fingerxie 创建的主题 程序员 阿里云 CodingPlan 计划太坑了吧
火山和阿里云都买了,火山多一天,是 29 天 [哈哈]
2 月 26 日
回复了 BeanzZ 创建的主题 程序员 这一次,让 AI 真正拥有“长久记忆”!-TiMem
很赞! 我研究一下。

但是 https://timem.ai/ 网站证书不太对,打开之后浏览器会告警,建议更新一下
不过现在想想,能早点儿换,总比后面再换的好。
@hopeofsteadylife 。。。其实我这里 db 就是简单的 数据库 (database) 的意思,就是:比数据库检索数据还快。
@Geon97 还在替换代码,估计要更久了
@restkhz 是的,非常赞同,这个技术绝对是 2026 年非常非常有重量的,非常有想象力的做法。

想想一下,那些对速度有非常高要求的垂直场景:高速行驶的汽车、具身机器人的大脑的部分功能(或者小脑)

另外据我了解,中国的公司因为 llm 训练 gpu 技术不行,其实一直都在押宝 ASIC 芯片路线的。
今天看到 https://www.anuragk.com/blog/posts/Taalas.html 这里讲的:技术原理

1. 固定功能 ASIC 架构
Taalas 的芯片是一种固定功能 ASIC (专用集成电路),类似于 CD-ROM 、游戏卡带或印刷书籍——只能运行一个特定模型,无法重写。
他们将 Llama 3.1 的 32 层网络结构直接蚀刻到硅片上,模型权重成为物理晶体管,而非存储在内存中的数据。

2. 突破"内存墙"
传统 GPU 的瓶颈:GPU 需要从 VRAM/HBM 反复读取每一层的权重矩阵,进行计算后将中间结果存回内存。这种频繁的内存读写造成延迟和能耗(即"内存墙"或冯·诺依曼瓶颈)。
Taalas 的方案:输入向量直接流入第一层物理晶体管,通过他们发明的"魔法乘法器"(单个晶体管实现 4-bit 数据存储和乘法运算),电信号通过物理导线直接流入第二层,依此类推,直到生成最终 token 。无需外部内存来回搬运数据。

3. 芯片制造策略
他们设计了带有大规模通用逻辑门和晶体管网格的基础芯片。
针对特定模型,只需定制最上面的两层光罩即可,无需从头制造芯片。
为 Llama 3.1 8B 开发专用芯片仅用了 2 个月——在 AI 领域虽显漫长,但在定制芯片领域已属极快。

4. 内存使用
不使用外部 DRAM/HBM ,但包含少量片上 SRAM:
存储 KV Cache (对话的上下文窗口)
支持 LoRA 适配器进行微调
@catazshadow 这才开始,后面慢慢优化起来,很有想象力啊。
@renfei 是的,精度不行,但这推理速度,让很多事情很有想象力了。尝试了一下大段翻译,超级快,而且基本正确。
2 月 21 日
回复了 rmrf 创建的主题 程序员 买了 Qoder ,此前公司有提供来着
@hongye 多谢提醒,我去看看
2 月 18 日
回复了 rmrf 创建的主题 程序员 买了 Qoder ,此前公司有提供来着
@shenyankm [握手] ,今天在 Qoder 中尝试了一下新支持的 qwen3.5-plus ,体验也很好。而且只要 0.2x 。感觉大部分事情其实用 0.2x 就完全够用了。
2 月 17 日
回复了 rmrf 创建的主题 程序员 买了 Qoder ,此前公司有提供来着
trae 没有 Linux 版本,我现在编程主力机在 Fedora 上,因此用不了。虽然那个 cli 是可以用在 linux 上,但我完全想不明白既然都用了人家 vscode 来做 IDE 了,偏偏摘掉了 Linux 支持是为了啥?

另外用了 Qoder 直接就可以用目前最新的几个国产模型,GLM5, Kimi2.5, MimiMax2.5 ,而且是以很低的 Credit 的消耗的系数进行使用的。分别是 0.5x, 0.3x, 0.2x ,简直非常良心了,省的我去各家平台花钱了。
2 月 14 日
回复了 abcfreedom 创建的主题 职场话题 年前这段时间上班是真的爽
哈哈哈哈哈
@DOLLOR #10

说重点了啊,就是点击了钓鱼邮件中的链接才这样的,链接千万不能随便点击。。。。
steam 玩家 买了不吃亏,我觉得很赞。
2025 年 8 月 25 日
回复了 rmrf 创建的主题 游戏 看完小孩 2025 EWC 街霸六 卫冕冠军,很有感触
刚刚上班跟公司同事聊了一下这个事情,大家一致的感慨就是:

面对如此强大的 Blaz ,在 0:3 大比分落后的情况能翻盘,简直不可思议。

就凭这个,小孩就可以封神了。
2025 年 8 月 25 日
回复了 rmrf 创建的主题 游戏 看完小孩 2025 EWC 街霸六 卫冕冠军,很有感触
@Phariel #39

原来如此,终于了解到了,我说为啥大家都挺厌恶 snk 的。
2025 年 8 月 24 日
回复了 rmrf 创建的主题 游戏 看完小孩 2025 EWC 街霸六 卫冕冠军,很有感触
@leiphi #17

决赛的精彩程度逆天了,看直播会紧张死。我看回放都觉得不可思议,Blaz 这开挂一样的天赋,这能输?!
2025 年 8 月 24 日
回复了 rmrf 创建的主题 游戏 看完小孩 2025 EWC 街霸六 卫冕冠军,很有感触
@coderlxm #16

刚刚看 b 站上有人分析最后小孩的反杀,居然是绿冲过去偷帧的最优解,只有一种情况可以完成直接 ca 反杀,就是 Blaz 抢了一个轻拳 跟 小孩 相杀。然后这种唯一解就真的发生了,简直是神奇。

然后有人评论说,Punk 对小孩那场,只有一种情况 Punk 能输掉比赛(半场开香槟),然后这种情况居然也发生了。
2025 年 8 月 24 日
回复了 rmrf 创建的主题 游戏 看完小孩 2025 EWC 街霸六 卫冕冠军,很有感触
@frankies #13

zhen 的水平也还是挺高的,只是在这种全球高手面前,感觉还是差了一些火候。
1  2  3  4  5  6  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5954 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 02:14 · PVG 10:14 · LAX 18:14 · JFK 21:14
♥ Do have faith in what you're doing.