neteroster 最近的时间轴更新
neteroster

neteroster

V2EX 第 191331 号会员,加入于 2016-09-11 21:01:55 +08:00
今日活跃度排名 3019
根据 neteroster 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
neteroster 最近回复了
8 天前
回复了 Devine 创建的主题 问与答 Qwen github 访问不了
被 GitHub 封组织了:

https://x.com/JustinLin610/status/1831489956512198862

我之前也见到一个仓库( LunaTranslator )在没有任何说明的情况下直接被 GitHub 干掉,后来申回来了,只能说 GitHub 有时候是会抽风(
33 天前
回复了 ChipWat 创建的主题 程序员 mac mini 24g 大模型推理怎么样
@unidotnet #1
14B 4 位怎么可能 40G ,bf16 不加上下文都没这么大
@neteroster 网页版免费,也可以直接用
楼上 DeepSeek 充 100 ,+1 。没人恶意乱刷肯定够用,编程相关就用这个,劲大!
52 天前
回复了 CNYoki 创建的主题 程序员 ollama 本地模型 GPU 跑不满
用 vLlm 。
mini 阉割太狠,一个字就是蠢,能力上与其说是 4o 的阉割版不如说是 3t ( 1106 ) 的加强版,加的还不多。甚至在某些 benchmark (例如 https://aider.chat/docs/leaderboards/ )上相比 3.5 还出现倒退。我自己比较关注翻译,mini 更是一塌糊涂。
那我为什么不选择 1/2 RMB 每百万 Token 的 DeepSeek 呢(
59 天前
回复了 Nostalghia 创建的主题 OpenAI 有人试过用大模型翻译长篇英文书吗?
都是分段的,没人一次性翻全部
96 天前
回复了 smalltong02 创建的主题 程序员 对 Qwen 2 模型代理能力的完整测试
很好的测试。Qwen2 确实是非常优秀的一组模型,特别是多语言能力方面的改进可圈可点。阿里选择将模型(除 72B )以 Apache2.0 开源也是非常慷慨。期待未来更强的模型。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2444 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 15:41 · PVG 23:41 · LAX 08:41 · JFK 11:41
Developed with CodeLauncher
♥ Do have faith in what you're doing.