神经网络中softmax的导数计算

本文主要分析神经网络中softmax层导数的计算,其表达式为:

等式两边求微分,得(注意公式中$\vec{1}^Texp(x)$是一个标量):

这里用到了公式:

根据微分与梯度对应关系可知:

最终结果:

参考资料