V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
cowcomic
V2EX  ›  问与答

llama-3-sqlcoder-8b 微调效果不好,求助

  •  
  •   cowcomic · 87 天前 · 1261 次点击
    这是一个创建于 87 天前的主题,其中的信息可能已经有所发展或是发生改变。
    使用 LoRA 进行微调

    大约 1W 条微调数据,大概是四个维度各十几种排列组合来的

    学习率:1e-6
    训练轮数:10
    学习率调节器:Inverse Square Root

    学习的参数大概是这么多
    trainable params: 20971520 || all params: 8051232768 || trainable%: 0.2605

    图像看着倒还不错


    但实际生成的 SQL 效果不升反降

    求助这可能是什么原因啊?
    6 条回复    2024-10-02 17:35:23 +08:00
    chaucerling
        1
    chaucerling  
       87 天前
    轮数太多过拟合了吧,取 1000 的 checkpoint 试试效果
    Volekingsg
        2
    Volekingsg  
       87 天前
    干脆直接整个 online evaluator 看看训练过程中的效果
    cowcomic
        3
    cowcomic  
    OP
       87 天前
    @chaucerling 好的,我去试试

    @Volekingsg 这是啥意思,我用的是 LLaMA-Factory ,有这个功能吗?
    Volekingsg
        4
    Volekingsg  
       86 天前
    @cowcomic #3 我都是基于 Lightning 框架自己写的,LLaMA-Factory 不确定怎么加
    cowcomic
        5
    cowcomic  
    OP
       86 天前
    @Volekingsg 感谢,我去查查
    Volekingsg
        6
    Volekingsg  
       85 天前
    @cowcomic #5 就是自己加个 Callback 之类的东西,每个 epoch 或者多少次 evaluate 一次 text2sql 的性能看看
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2647 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 00:25 · PVG 08:25 · LAX 16:25 · JFK 19:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.