PyTorch里.pt和.pth的区别

sky丶Mamba

于 2025-06-30 14:21:30 发布

阅读量606

点赞数 5

CC 4.0 BY-SA版权

分类专栏： AI 文章标签： pytorch 人工智能 python

本文为博主原创文章，未经博主允许禁止转载。如有问题，欢迎指正。

11 篇文章

订阅专栏

在PyTorch中，.pt和.pth文件均用于保存模型，但两者在设计初衷、存储内容和使用场景上存在差异。以下是详细对比：

.pt文件
- 生成代码：torch.save(model, "model.pt")
- 优势：包含完整的模型信息，适合直接用于推理或迁移到无代码环境。
- 风险：若模型类定义变更，加载可能失败（需确保代码兼容性）。
.pth文件
- 生成代码：torch.save(model.state_dict(), "model.pth")
- 优势：灵活性高，可加载到不同结构的模型中（如迁移学习）。
- 限制：需手动重建模型结构，否则无法直接使用。

历史演变：
- .pth曾是早期PyTorch的默认格式，后逐渐被.pt取代（尤其PyTorch 1.6+）。
- .pt现为官方推荐格式，支持更完整的序列化（如TorchScript）。
命名惯例：
- .pt多用于完整模型或TorchScript导出。
- .pth仍广泛用于参数保存（如Hugging Face库）。

安全性：
- 两者均基于pickle序列化，存在代码注入风险，需确保文件来源可信。
- .safetensors（Hugging Face推出）是更安全的替代方案。
加载效率：
- .pth因体积小，加载更快。
- .pt支持内存映射（如TorchScript优化后），适合大模型。