pytorch的state_dict，拷贝问题

2024-05-02 04:12•HTML/CSS•阅读 737

先说结论，model.state_dict()是浅拷贝，返回的参数仍然会随着网络的训练而变化。应该使用deepcopy(model.state_dict())，或将参数及时序列化到硬盘。

再讲故事，前几天在做一个模型的交叉验证训练时，通过model.state_dict()保存了每一组交叉验证模型的参数，后根据效果选择准确率最佳的模型load回去，结果每一次都是最后一个模型，从地址来看，每一个保存的state_dict()都具有不同的地址，但进一步发现state_dict()下的各个模型参数的地址是共享的，而我又使用了in-place的方式重置模型参数，进而导致了上述问题。

上一篇 »关于Python 的dict 是否有序问题
下一篇 »[Python]字典的赋值、浅拷贝、深拷贝

pytorch的state_dict，拷贝问题

相关推荐

pytorch两种模型保存方式

PyTorch 介绍 | 保存和加载模型

pytorch查看网络权重

react中修改参数值没有重新渲染问题-关于浅拷贝与深拷贝

Pytorch-修改预训练参数

pytorch将部分参数进行加载

pytorch加载模型

pytorch中.pth文件转成.bin的二进制文件