预训练模型整体流程

graph TB
A(载入预训练模型) --> B(重载模型)
B --加入--> C(学习率)
B --加入--> D(优化器)
B --加入--> E(损失函数)
C --> F(初始化热身)
D --> F(初始化热身)
E --> F(初始化热身)
F --> G(训练)
subgraph 每个epoch 
   G --> H(计算损失)
   H --更新--> H
end
H --一定周期或条件--> Z(结束)

预训练模型整体流程
http://example.com/2023/12/01/预训练模型整体流程/
作者
Z
发布于
2023年12月1日
许可协议