pytorch中的nn.CrossEntropyLoss，

2024-04-06 00:56•java•阅读 4019

nn.CrossEntropyLoss()这个损失函数和我们普通说的交叉熵还是有些区别。

$x$是模型生成的结果，$class$是数据对应的label

$loss(x,class)=-log(\frac{exp(x[class])}{\sum_j exp(x[j])})=-x[class]+log(\sum_j exp(x[j]))$

nn.CrossEntropyLoss()的使用方式参见如下代码

import torch
import torch.nn as nn

# 表示模型的输出output(B,C)格式，B是batch，C是类别
output = torch.randn(2, 3, requires_grad = True) #batch_size设置为2，3分类
# 表示数据的标签label(B)格式，B是batch，其中的数值是位于[0,C-1]
label = torch.empty(2, dtype=torch.long).random_(3) # 0 - 2， 任意选取一个分类
print(output)
'''
tensor([[-1.1313,  0.5944, -1.5735],
        [ 1.2037, -1.0548, -0.9253]], requires_grad=True)
'''
print(label)#tensor([0, 2])
loss = nn.CrossEntropyLoss()
#先对每个训练样本求损失，而后再求平均损失
print ('loss :', loss(output, label))#loss : tensor(2.1565, grad_fn=<NllLossBackward>)

上一篇 »pytorch中的权值初始化
下一篇 »Pytorch: torch.nn

pytorch中的nn.CrossEntropyLoss，

相关推荐

pytorch JIT浅解析

pytorch系列 -- 9 pytorch nn.init 中实现的初始化函数 uniform, normal, const, Xavier, He initialization

【python学习笔记】pytorch中的nn.Embedding用法

Pytorch中的nn.Sequential

pytorch中词向量生成的原理

pytorch中的nn.Embedding

pytorch中的model.eval，和BN层

pytorch教程之nn.Sequential类详解——使用Sequential类来自定义顺序连接模型