1
raycool 1 天前 理论上是
只是微调的效果不可控,并且算力的需求比 RAG 大太多了。 |
2
HHHans 1 天前
gpt3.5 刚出来的时候微调还很火热,现在已经没人提了。。
|
3
owt5008137 1 天前
正常模型本就是分初始预训练和继续预训练的,你说的二次训练怕不就是继续预训练。然后后面才是微调和对齐训练。
|
4
gorvey 1 天前
cursor 的自研模型就是这么干的,底模是 kimi-k2.5 ,注入 cursor 中高质量的对话训练的
|
5
XenoGear 1 天前
你有卡当然可以,普通人压根没有足够的资源来训练大模型
|
6
archxm OP @XenoGear 话说,既然 ai 真这么火热,云服务商,或者其他公司,应该可以提供这种租借服务吧。但要签协议,保证不摄取用户数据,帮用户训练二次模型。
我感觉这个需求还是停常见的。 |
7
kennylam777 22 小时 36 分钟前 |
8
archxm OP @kennylam777 好的,又学到新术语
|