1
yitdlxl 2023-08-25 08:04:32 +08:00
总的来说,在 A100- 80 GB ( TDP 为 350- 400 W )的硬件上训练所有 9 个 Code Llama 模型需要 400 K GPU 小时的计算。估计总排放量为 65.3 吨二氧化碳当量
|
3
mxmbfa 2023-08-25 08:10:35 +08:00 via Android
现在有好多水平和 3.5 相当的 ai 好开心
|
4
westlinkin 2023-08-25 10:01:39 +08:00
好像不能在 m1 上跑
|
5
janwarlen 2023-08-25 10:49:54 +08:00
Code Llama: our base models designed for general code synthesis and understanding
Code Llama - Python: designed specifically for Python Code Llama - Instruct: for instruction following and safer deployment Code Llama - Instruct 主要侧重点是啥,没看明白英文,英文渣,侧重于运维部署? |
7
cryptogems 2023-08-25 18:43:53 +08:00
意思是更符合人的直觉,类似对话的模式,前面两个差一些
|
12
chesha1 2023-08-26 13:57:52 +08:00
|
13
DIMOJANG 2023-08-26 14:04:01 +08:00
|