2.5 加油站之高等数学知识回顾_PyTorch深度学习实战：从新手小白到数据科学家-QQ阅读女频古言网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

2.5 加油站之高等数学知识回顾

又到了“补充营养”环节，持之以恒定有收获！

2.5.1 方向导数和梯度

在神经网络的迭代优化过程中需要求各个权重的偏导数，从而用更新公式的方式更新权重，达到优化的目的。本节主要回顾高等数学中的方向导数及梯度的概念，使读者更加清楚神经网络中的偏导数。

在数学中，一个多变量的函数的偏导数是它关于其中一个变量的导数而保持其他变量恒定。在一元函数中，导数就是函数的变化率；二元函数的变化率比较复杂，因为它多了一个自变量。如图2.28所示，在XOY平面内，当动点由P(x₀,y₀)处沿不同方向变化时，函数f(x,y)的变化速度一般来说是不同的，因此需要研究f(x,y)在点(x₀,y₀)处沿不同方向的变化率。

图2.28 偏导数

如图2.28所示，Z是关于x和y的函数，Z的变化受x和y的变化的影响，x的变化速度和y的变化速度对于Z的影响是不同的，如同下山，沿着水平方向移动和沿着垂直方向移动，对于达到下山目的的快慢是有不同影响的，沿着X轴和沿着Y轴的变化率就是偏导数。函数Z的偏导数只有两个，但是这两个偏导数产生的合向量却有无数个，并且方向是任意的，这两个偏导数的合向量被称为方向导数。

偏导数的数学定义如下：设函数Z=f(x,y)在点(x₀,y₀)的某个邻域内有定义，固定y=y₀，一元函数f(x,y₀)在点x=x₀处可导，则x的导数等于x=x₀处的极限，即

称A为函数Z=f(x,y)在点(x₀,y₀)处关于自变量x的偏导数，记作f_x(x₀,y₀)。从上面的定义可知，偏导数的几何意义为变量方向上的斜率，即对应方向上变化的快慢程度。

上面回顾了偏导数的定义，请据此求出f(x,y)在点(3,4)处的偏导数。

f(x,y)=x³+2xy+y³

x的偏导数为f_x(x,y)=3x²+2y。

y的偏导数为f_y(x,y)=2x+3y²。

将点（3，4）代入即可求出f(x,y)的偏导数。参考结果为f_x(3,4)=3×3²+2×4=35,f_y(3,4)=2×3+3×4²=54。

下面以“蚂蚁远离火源”为例介绍方向导数，如图2.29所示。

图2.29 蚂蚁远离火源与方向导数

在二维平面上，一只蚂蚁为了逃避大火的炙烤会选择远离火源，它可以沿着X轴向右撤离，也可以沿着Y轴向上撤离，还可以沿着X轴和Y轴的某一夹角的方向撤离。实际上，最聪明的方法是沿着y=x的方向远离火源，因为在这条直线撤离能最快远离火源。

在数学中，为了定义函数沿着某个方向变化的快慢，产生了方向导数的概念，如同下山，你可以有几百种下山的方式，不同的下山方向有不同的变化，但是最快捷的下山方式只有一种。如图2.29中的第二张图所示，X轴方向的改变量Δx和Y轴方向的改变量Δy以φ为夹角组成方向向量L，代表蚂蚁实际撤离的方向，在该方向撤离的变化速度就是其方向导数。

沿L方向的方向导数的定义如下：如果函数的增量f(x+Δx,y+Δy)-f(x,y)与PP′的距离的比值存在，则将其称为P点沿L方向的方向导数。

关于方向导数有如下这样一个定理：如果z=f(x,y)在点P(x,y)处可微分，那么在该点沿着任意方向的方向导数都存在，并且方向导数为

式中，φ为X轴到方向L的夹角。请读者尝试求函数z=xe²^y在点p(1,0)处沿着p点到q(2,-1)的方向导数。

参考答案如下：方向向量为，X轴到方向向量L的夹角为；；。所以，方向导数为，你求对了吗？

方向导数和梯度的关系如下：在数学定义中，梯度表示最大的方向导数，并且梯度的方向和方向导数取得最大值时的方向一致。这也是梯度下降优化算法名称的由来，即梯度的方向是优化的最佳方向。

2.5.2 微分及积分

下面先回顾微积分的重要思想。微积分起源于17世纪，主要帮助人们解决各种速度、面积的求解等实际问题，图2.30所示就是使用微积分求面积的典型例子。

图2.30 使用微积分求阴影部分的面积

在微积分出现之前，古人计算图2.30中阴影部分的面积的方法是“以直代曲”，古人没有求取阴影部分的面积的工具和数学知识，于是采用近似计算的方式估计阴影部分的面积。具体的做法如下：将阴影部分划分成较小的矩形，利用矩形公式近似计算阴影部分的面积，如图2.31所示。

图2.31 “以直代曲”求阴影部分的面积

将阴影部分划分成4个矩形，利用矩形面积公式计算每个矩形的面积，最后将4个矩形的面积累加即可得到阴影部分的面积，虽然不是很精确，但可以估算大概值。如果将矩形划分得足够小，对阴影部分面积的估计就会更加准确，这也是微分思想的雏形。假设在a和b之间插入若干个点，得到n个小的区间，每个小矩形的面积为A_i=f(ε_i)Δx_i，于是近似得到阴影部分的面积：A=，当n→∞时，每个小矩形的边长λ→0，于是可以得到阴影部分精确的面积：A=。莱布尼兹在研究过程中为了体现求和（Sum）的感觉，将S拉长，于是出现了后来的简写符号“∫”，因此上面的面积公式变成如下形式：