V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  mumbler  ›  全部回复第 1 页 / 共 86 页
回复总数  1715
1  2  3  4  5  6  7  8  9  10 ... 86  
1 天前
回复了 ztm0929 创建的主题 问与答 开源大模型的“源”到底是什么?
@ztm0929 #5 开源的好处是模型可调,算力可控,你可以用自己的 GPU 本地部署开源模型,需要用的时候才开机,只需要付电费,便宜,而云端算力就算空闲你也要付 GPU 费,贵

想体验下部署本地模型,目前最简单的方法是用 flashai.com.cn 提供的整合包,一键下载,开箱即用
1 天前
回复了 ztm0929 创建的主题 问与答 开源大模型的“源”到底是什么?
@mustcool #6 数据集肯定有严重的版权问题,没法开源
1 天前
回复了 ztm0929 创建的主题 问与答 开源大模型的“源”到底是什么?
@ztm0929 #5 fine-tune 付费服务主要是为算力付费,模型都是免费的,至少现在没收你钱
微信就是个邮箱
1 天前
回复了 ztm0929 创建的主题 问与答 开源大模型的“源”到底是什么?
大模型开源的是权重文件,你可以用自己数据去微调这个权重,而不用从头去训练
@jeffwcx 合理推论,国产模型训练都用 llama 不是什么秘密
1 天前
回复了 XYZ168 创建的主题 分享发现 报道说 OpenAI 今年或巨亏 50 亿美元
已经退订 chatgpt plus ,转投 claude pro 了,artifacts 把我开发效率提升了 10 倍
@xoxo419 当然可以,8B 模型只需要 6G 内存,有 M 芯片加持,速度飞快,mac 包刚刚通过苹果做审核,现在可以下载了
@wanghui22718 下载也是用户体验的一部分,我们初心就是极致的大模型本地部署体验,在任何电脑上开箱即用,不依赖环境,不用具备相关技术知识,all in one
@sunnysab 从零训练一个大模型,是很贵的,开源模型的大爆发就是从 llama 发布开始的,如果 qwen2 是从 0 训练的,也应该跟 1.5 一样有 14B ,32B 这些参数,为什么没有? 因为 llama3 没有
@DaiShu888 正在上传,很快就好
@yekern 赶紧再微调一个 3.1 的,基座比 3 强了不少
@walkingmoonwell 知识库已经很成熟了,可以用 flashai 免费体验一下,硬件有个 gpu 体验更好
@jeffwcx
llama2 有 7b 13b 33b 70b,qwen1.5 有 7b,14b,34b,72b
llama3 有 8b 70b,qwen2 有 7b ,72b
是不是一样的
@gzlock ollama 只是一个命令行,要用图形界面需要安装 webui ,要用知识库需要安装 anything ,对普通人太麻烦,flashai 底层也是 ollama ,集成了图形界面,知识库,不用一个个去安装了,更方便不是吗
@B4a1n 官方没有说正式支持中文,可能中文语料训练得少,国产模型大都基于 llama3 训练的,很快会出来一堆。10B 以下模型里中文能力目前最好的是 gemma2 9B ,英翻中特别厉害
清空 app 缓存就行了,屡试不爽
1  2  3  4  5  6  7  8  9  10 ... 86  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1097 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 23:31 · PVG 07:31 · LAX 16:31 · JFK 19:31
Developed with CodeLauncher
♥ Do have faith in what you're doing.