世界著名数学家、菲尔茨奖获得者、哈佛大学终身教授丘成桐先生说过:
本人深以为然!
遂决定为那些对微积分感兴趣的中二以上的少年们写几篇微积分小文章,这是其中的第一篇。
本文尽量用通俗、浅显和形象的语言来讲述,做到条理清晰、提纲挈领。对于那些刚开始学微积分的大一新生同样具有一定的借鉴作用。当然,对那些已系统的学完高数的人来说,本文也有一定的复习和参考作用。
导数和微分是微积分的基础,而微积分是自然科学的数学基础。这无疑说明,导数和微分是非常非常重要的。因此,我们就从这部分开始吧。
先来看什么是导数。
考虑函数 ,自变量 由 变到 ,函数值相应由 变为 ,如果我问你,函数值随自变量的变化率是多少,你应该会给出以下计算
很显然,这个变化率与 及 有关。例如,在下图中,我们看到,当保持 不变时,随着 减小, 减小的更慢一些,因此变化率越来越小。表现为那条红线的倾角越来越小。
如果函数 与 之间是一次函数的关系,画出来就是一条直线。那么 随 的变化率是恒定的,它就是直线的斜率值。
相反,如果换一个更复杂的函数,随着 的减小,它的变化率会经历复杂的变化,相应的,那条红线的倾角也不是单纯的增加或减少。
但无论如何,你会发现,当 无限减小时,这个红线会归于一条经过 的切线。这个变化率的极限等于该切线的斜率。它是函数在点 处 随 的变化率。
也就是说,这个特殊的变化率不是通过一个有限大小的自变量变化来获得,而是当自变量的变化趋于零时取得的。
这个特殊的变化率就是函数在点 的导数,数学表达式为 函数变量 上面带一撇就代表它的导数,也可写为 或 。
导数只与函数形式以及点的坐标有关,因此它也是一个 的函数。这个新的函数给出被求导的函数在所有点的切线的斜率,也被称作导函数。
作为一个导数的例子,瞬时速度就是在平均速度的基础上,通过不断减小时间长度直到无限小时得到的一个极限值,因此瞬时速度就是位置 对时间 的导数。
那么,是不是任何函数在任何位置都存在导数呢?
当然不是!
根据上面提到的,导数本质就是函数在各处的切线的斜率,所以,若在某处这个切线不存在,那就自然没有斜率,也就没有导数了,我们称函数在该点不可导。
例如下面这些函数,在某些位置是不可导的。
具体说来, 在 处不存在导数,因为从左边或者右边无限趋近这一点,函数的变化率存在两个不同的值,这说明极限不存在,因此在该点导数不存在。
对 ,在 处,切线的斜率是无限大,因此导数无限大,我们人也认为在该点导数不存在。
对 ,由于函数在 处不连续,切线不存在,因此在该点导数也不存在。
对最后那个函数,同样因为在 处不连续,因此函数在该处不可导。
总结起来就是:在不连续的位置,函数必定在该处也不可导,若有点没有切线或切线斜率取值无穷大,那么函数在该处也不可导。
如果你对得到的导函数继续求导,那将得到高阶导数。当然,能这么做的前提是函数的各阶导数都存在。
那么,如何求函数的导数呢?
基本出发点就是上述导数的定义!下面举例说明。
例1. 设函数 ,求 并求在坐标 处的导数值。
解:根据上述定义 将右边待求极限的式中的完全平方式展开,结果为 即为 ,显然当 时,它的值为 ,故得 代入坐标值 到 中,得导数值为 。
再来看一个稍复杂的例子。
例2. 求函数 的导数,其中 且 。
解:根据导数定义, 做到这里,遇到了一个较难的问题,被求极限的分式的分子分母都是无穷小!有人认为它们的比应该是1,其实这是错误的!
两个无穷小的关系可以有三种可能,具体解释见如下浅色字体部分,不感兴趣可以跳过。
此外,求导还有一些定理和推论也很重要,其中最典型的有如下四个。
(1) 函数和的导数:两个函数的和的导数等于它们的导数之和,即
(2) 函数积的导数:两个函数的乘积的导数等于每一个函数的导数与另一个函数的乘积之和,即 (3) 复合函数的导数:设有函数 以及 ,则 是 的复合函数 ,那么 对 的导数为 (4) 反函数的导数:函数的反函数的导数等于该函数的导数的倒数,设 的反函数为 ,则
记住:求导多了,记得多了,就熟能生巧了,不要一开始就想什么都会。
下面再看什么是微分。
在上面讲导数的时候,我们提到,导数是在自变量值和函数值的增量都取无限小时,函数的变化率。换句话说,导数是函数变化率的极限。
为了简便,我们可用专门的符号来表示这里的无限小量,即无限小的自变量增量 和函数增量 ,分别表示为 和 ,即
这种符号是德国伟大的数学家莱布尼兹(Gottfried Wilhelm Leibniz)发明的。它们所表示的量无限趋近于零,但却不等于零,我们称之为微分。
请务必仔细体会并抓住微分的这一极限思想!当年莱布尼兹就是根据这一思想定义切线的:让曲线上那个动的点无限靠近那个不动的点,但两点始终不会重合。你想想,只有两个点才能确定一条直线,如果重合了就没法确定直线了!
所以,不得不佩服,莱布尼兹想法何其美哉!
对函数 , 是自变量的微分,而 与 都可以等价的表示函数的微分。
数学里有个习惯,变量一般用斜体表示。既然这里的 只是一个符号,严格讲不应该用斜体。不过即使用斜体,问题也不大。
除 和 之外, 的导数也可表示为 据此符号,导数中很多规律可以写的更加简洁。例如,由 和 构成的复合函数 的导数为 下面再来看函数的微分与导数的关系。
对函数 来说,在某个坐标 附近,函数增量 随着自变量增量 变化。如果 不是太小,这两个增量之间的比例关系是不确定的。
但当 越来越小时,它们之间的比例就越来越接近所在点的切线的斜率,表述出来就是
这里的 代表一个随 变化的小量。在上式两边乘以 得 一般习惯用符号 代替 ,表示一个高阶小量,因此上式即为
所谓高阶小量,你可以理解为是小量的高次幂,例如2次方以上。相对小量,它的高次幂更小,当小量趋于零时,高阶小量就变成高阶无穷小了。因此,当自变量的增量无限小时,就可以忽略这个高阶小量了。
随着自变量的增量无限减小,这个等式右边的 以更快的速度趋于零,直到过渡到微分式:
这个关系告诉我们,当自变量的增量无限小时,函数的增量与自变量的增量之间只差一个系数—— 在该处的取值。换句话说,这两个增量之间是一个简单的比例关系——也称线性关系。
微分一词在此处看起来是一个名词,但随着我们后面学习积分,微分也表示将整体分割成微小的单元的意思,那时它也就成为一个动词了。
上述导数和微分只是针对一元函数而言,若函数为多元函数,情况又是怎样的呢?
设有二元函数 。若变量 变为 ,造成 → ,这可表示为
类似于一元函数,当 趋于零时, 与 的比值也表示函数在点( , )的变化率。只是这个变化率纯粹由 的变化导致,它也是一种导数,称之为偏导,表示为 上式左边就是偏导的符号表示——一个整体的符号。相对导数符号,用 代替了 。它们都表示无穷小量,表示 时的增量。
偏导有时也用带有自变量下标的函数符号表示,例如 表示函数对 的偏导。
既然偏导也是函数,那么与导数一样,你可以对偏导继续求某个自变量的偏导,只要它存在偏导数。例如,你可对 再求 的偏导,得到 。
如何求偏导?只需按照偏导的定义计算即可。下面举个求偏导的例子。
考虑如下函数
根据偏导定义,与第1节求导的例子类似,很容易得到,它的两个偏导分别为可见,求偏导时,你只要把其他的变量都当作常数即可,因此偏导其实与导数没什么太大的区别。
与导数类似,如果你关注偏导在某个特定的点 的取值,那么它就是曲面上对应该点的一条切线的斜率,即一个数。如果不限制,也就是考虑所有点的情况,那么偏导依旧是一个函数。
为了更清楚的理解偏导的意义,将上述函数及其导数画在下图中,带格子的曲面由满足该函数的所有坐标点构成。
假想你在这个曲面上沿着平行于 轴方向移动,你将在曲面上走出一条曲线,这条曲线就是函数对 的偏导所描绘的曲线;如果你沿着平行于 轴运动,当然就走出函数对 偏导所描绘的那条曲线。它们就是上图中那两条蓝色的曲线。
并且,在这两条曲线上,不同位置的切线的斜率就是该处函数偏导的值。例如,上图中两条红色直线的斜率就分别代表位于点 处的两个偏导值,它们的值分别为 可见,在点 处,当沿着 方向走时,路途更艰险,因为斜率更大——坡度更大。
从曲面上任一点出发,沿不同方向走,有不同的坡度,分别对应不同的切线的斜率,它们就是曲面函数在该点的各个方向导数,而偏导不过是其中两个最特殊的方向导数。
关于方向导数,以后再与梯度一起讲。
设有函数 ,根据偏导的定义式 若将其中的极限符号去掉,这个等式不再成立,等号两边之间相差一个与 相关的小量 ,即
这个 在当 时为无穷小。现将两边同时乘以 ,并用高阶小量 表示 ,上式变为
类似的,如果是 发生变化,即 则也相应的有
你大概也看到了,这两个 的式子与前面讲微分部分关于高阶小量的式子是类似的。
不过,上述 都是不完整的,它们都只是某一个自变量的增量导致的函数增量。若 和 都发生变化,则函数增量应该是
我们可以将这个变化分两步完成,即 注意,上式中 取值点是 ,而 取值点是 。但当 和 都趋于零时,这两个点无限靠近,两个偏导也都在两个无限靠近的两点处取值。而此时后面的高阶小量也趋于零, 遂用 代替 ,因此得到 这说明,当自变量的变化都趋于无穷小时,只要将自变量的增量与对应偏导的乘积加起来,就是函数的增量,这就是函数 的全微分。
类似的,拥有超过2个自变量的函数的全微分也可以照此写出,例如函数 的全微分是 你大概悟出了一个规律:函数在任意坐标处的全微分,等于它在此处的自变量的微分的线性组合,其组合系数分别就是对应的偏导值。若对任意点求全微分,则只要将这些偏导值推广为偏导函数即可。
并且你还发现,偏导可看作是导数的特例,而微分不过也是全微分的特例罢了。
到此,本文主要内容已讲完了。下面是多元复合函数的导数和微分,可根据兴趣选读。
设有一个二元函数 ,它的自变量 和 又是 的函数,如何求 对 的导数呢?
利用上节得到的那个 表达式 两边同时除以 得 由于 和 都是高阶小量,除以小量 之后仍然是小量,它们在 时都趋于零。故对上式两边取 即为 这就是多元复合函数的导数,也称全导数。
很容易想到,如果是超过两个自变量的函数,只要加上新的变量的偏导与它对中间变量的导数乘积即可。例如函数
的全导数为 为了便于记忆,你可以将全导数看成是在全微分的基础上除以求导变量的微分所得的结果。
如果函数的中间变量也是多元的,那么就没有全导数,只有偏导数。此时,只要把涉及的导数用偏导代替即可,例如函数
的两个偏导数为 按照上节全微分内容可知 如果再写出 和 的全微分,代入上式,就会得到用 和 的微分表示的函数 的全微分:这些规则看起来挺繁琐,但背后的规律很简单。只要摸清规律,就可以轻松写出来。