llama-3-sqlcoder-8b 微调效果不好，求助 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 501 天前的主题，其中的信息可能已经有所发展或是发生改变。

使用 LoRA 进行微调

大约 1W 条微调数据，大概是四个维度各十几种排列组合来的

学习率：1e-6
训练轮数：10
学习率调节器：Inverse Square Root

学习的参数大概是这么多
trainable params: 20971520 || all params: 8051232768 || trainable%: 0.2605

图像看着倒还不错

但实际生成的 SQL 效果不升反降

求助这可能是什么原因啊？

6 条回复 • 2024-10-02 17:35:23 +08:00

1

chaucerling

2024 年 9 月 30 日

轮数太多过拟合了吧，取 1000 的 checkpoint 试试效果

2

Volekingsg

2024 年 9 月 30 日

干脆直接整个 online evaluator 看看训练过程中的效果

3

cowcomic

OP

2024 年 9 月 30 日

@chaucerling 好的，我去试试

@Volekingsg 这是啥意思，我用的是 LLaMA-Factory ，有这个功能吗？

4

Volekingsg

2024 年 10 月 1 日

@cowcomic #3 我都是基于 Lightning 框架自己写的，LLaMA-Factory 不确定怎么加

5

cowcomic

OP

2024 年 10 月 2 日

@Volekingsg 感谢，我去查查

6

Volekingsg

2024 年 10 月 2 日

@cowcomic #5 就是自己加个 Callback 之类的东西，每个 epoch 或者多少次 evaluate 一次 text2sql 的性能看看

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 3510 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 30ms · UTC 03:47 · PVG 11:47 · LAX 19:47 · JFK 22:47
♥ Do have faith in what you're doing.