1
yitdlxl 251 天前
总的来说,在 A100- 80 GB ( TDP 为 350- 400 W )的硬件上训练所有 9 个 Code Llama 模型需要 400 K GPU 小时的计算。估计总排放量为 65.3 吨二氧化碳当量
|
3
mxmbfa 251 天前 via Android
现在有好多水平和 3.5 相当的 ai 好开心
|
4
westlinkin 251 天前
好像不能在 m1 上跑
|
5
janwarlen 251 天前
Code Llama: our base models designed for general code synthesis and understanding
Code Llama - Python: designed specifically for Python Code Llama - Instruct: for instruction following and safer deployment Code Llama - Instruct 主要侧重点是啥,没看明白英文,英文渣,侧重于运维部署? |
7
cryptogems 251 天前
意思是更符合人的直觉,类似对话的模式,前面两个差一些
|
12
chesha1 250 天前
|
13
DIMOJANG 250 天前
|