当前位置：首页 > news >正文

LoRA训练-理论基础

news 2025/6/30 7:38:33

一、数据集

图片

质量越高，种类越丰富，模型效果通常越好。高质量的图片可以提高模型的泛化能力。

版权

网上白嫖图片进行训练有一定的法律风险，图片是有版权的。但版权限制期限是100年，100年后所注册的版权/商标将会失效。所以根据梵高的风格创作的内容合法合规。

LoRA也有版权。在LibLib发布模型是有收入的。LibLib对模型的版权规则，只要我们生成的LoRA需要不商用，不侵权。~~可以用IPAapter融图，参考风格生成LoRA~~。

给AI喂了一定数量之后的图片之后，AI就会知道你想要什么，他能够根据你所提供的数据集去推理出新给的图片在该风格下应该呈现什么样的视觉表现。

风格LoRA

可以选择一些可商用的素材，同时需要注意画风的一致性。AI的训练能力和迭代能力是非常强的，他能够注意到图片中的所有细节，把数据集放在同一个文件夹下。

一个比较可行的方式：使用基础大模型批量生成指定风格的图片，从这些图片中选表现效果较好的图片，以这些图片为数据集，训练一个该风格的LoRA模型。这里就能看出LoRA的作用是让模型在某一个领域的生图表现优于基础模型。

人物形象LoRA

在影视作品中截图，更注重面部和五官的一致性。最好是不同表情，不同姿势和不同视角，但必须是同一个人/同一个年龄阶层。形象的一致性，发型可以改变

打标tag

循环轮次epoch

在一个训练轮次中，每张图片被重复训练的次数，在数据集较少的情况下，可以+循环次数。训练数据的不同，没有具体的标准数值参考，学习得不够收敛就+步数，过拟合就-步数，高轮次也会需要更高的算力和更多的训练时间。

二、优化算法

局部最优解local optimum

指优化算法在参数空间中找到一个区域的极值点（可能是最小值/最大值）但这个点并不是整个参数空间中最全局最优的解。这种现象会导致模型性能停滞，无法继续优化。

学习率热learning rate warm up

一种优化策略，通过在训练初始阶段逐步提高学习率（而非直接使用目标学习率），帮助模型稳定收敛并提升最终性能。

小数据集（<10k样本）建议缩短预热步数（如总步数的5%）

大数据集（百万级）可延长至总步数的10%~20%

学习率learning rate

学习率是机器学习算法中的一个参数，控制模型在每次迭代更新时对于权重&位置的调整程度，可以将学习率看作决定每一步“跨越”多大幅度的因素；

学习率过大，每一步更新的幅度会比较大，模型可能更快地收敛得到最优解，但也容易错过最优解附近的小波动，甚至发生震荡或无法收敛的情况。可能导致模型在损失函数曲面上跳跃，跳过全局最优解附近的区域，甚至直接跨过最优解。例如：在训练初期，若学习率设为0.1，模型可能在几个epoch内快速下降，但因步幅过大，无法稳定收敛到最优区域，反而在局部最优附近震荡。

学习率较小，每一步的变化都会比较小，模型的调整过程会相对稳定，但可能需要更多的迭代次数才能收敛得到最优解，训练速度可能会较慢。参数更新缓慢，可能被困在初始位置附近的局部最优解中，无法向全局最优方向移动。例如：学习率设为0.0001时，模型需要极多迭代次数，才能收敛，甚至因梯度消失而停滞在次优点。