预训练模型整体流程
graph TB A(载入预训练模型) --> B(重载模型) B --加入--> C(学习率) B --加入--> D(优化器) B --加入--> E(损失函数) C --> F(初始化热身) D --> F(初始化热身) E --> F(初始化热身) F --> G(训练) subgraph 每个epoch G --> H(计算损失) H --更新--> H end H --一定周期或条件--> Z(结束)
预训练模型整体流程
http://example.com/2023/12/01/预训练模型整体流程/