素质三连 optimizer.zero_grad() # 清空过往梯度; loss.backward(retain_graph=True) # 反向传播,计算当前梯度; optimizer.step() # 根据梯度更新网络参数