二、Stable Diffusion 赛博丹炉LoRA模型训练参数

2024-03-06 | 0 评论 | 0 浏览

参数调优

1. 训练参数分析

必看视频！！！ [全网最细lora模型训练教程]这时长？你没看错。还教不会的话，我只能说，师弟/妹，仙缘已了，你下山去吧！_哔哩哔哩_bilibili

1.1 步数相关 repeat / epoch / batch_size

【1】epoch多轮次比单轮次要好，通过设置可以每轮保存一组模型，多轮次说明有多组模型，得到好概率的可能是比单轮次就一个模型的概率是要高的，epoch一般设置5~10；

【2】batch_size要是高，一是可能显存带不动，二是值越高训练越快越可能学得囫囵吞枣收敛得慢。

BS从1到2，Ir就要*2

1.2 速率/质量相关 Ir学习率 / Dim网络维度 / Optimizer优化器

学习率Ir，控制了每次参数更新的幅度，过低参数更新幅度小训练收敛就慢陷入局部最优解训练时间增加，过低也会导致训练初期无法有效学习到特征；过高，参数更新幅度大错过全局最优解附近的局部最优解找不到稳定的收敛点，常用cos的学习率衰减策略，初始使用较大的学习率快读接近全局最优解，在随着训练的进行逐渐减小学习率，使得逐渐细化搜索空间，找到全局附近的局部最优解，提高收敛的稳定性。

前面提到的“bs提高，Ir也要提高”是因为bs较大时会导致参数更新的方差减小从而使得梯度更新幅度也减小，这时就需要Ir也相应地增大。我这里还在思考bs、Ir都提高了的话，训练速度是不是也会大幅度提高？chat告诉我不一定，因为bs大占用的内存和计算量也增加，Ir大模型容易不稳定不收敛，理论上肯定是会增加训练速度，但实际上还是要根据你的显卡来设置bs值，训练速度变向是看钞能力，跑起来才是王道，先优先考虑生成效果再训练速度吧~