事件:使用pytorch进行multi-task learning,训练到30-60 epoch的时候,机器卡死了。虽然是ubuntu也卡死了
原因:一通没头没脑地分析之后,原因可能是内存泄漏。
解决:
将数据记录到log文件以提供给tensorboard可视化分析的时候,注意要在结束时关闭 SummaryWriter
writer = SummaryWriter(os.path.join(ckptDir, 'logs'))
for epoch in range(num_epochs
事件:使用pytorch进行multi-task learning,训练到30-60 epoch的时候,机器卡死了。虽然是ubuntu也卡死了
原因:一通没头没脑地分析之后,原因可能是内存泄漏。
解决:
将数据记录到log文件以提供给tensorboard可视化分析的时候,注意要在结束时关闭 SummaryWriter
writer = SummaryWriter(os.path.join(ckptDir, 'logs'))
for epoch in range(num_epochs