第一部分 基础知识1.3 深度学习基础学习率调度(Warmup、Cosine、WSD)本页总览学习率调度(Warmup、Cosine、WSD) 训练规模与学习率 Batch Size vs Learning Rate openai 结论:更大的 batch_size 配备更大的 learning rate;更小的 batch_size 配备更小的 learning rate