Transformer模型训练动态