数学之美:几何视角下的高斯积分(Gaussian Integral)
By Long Luo
从之前的文章 正态分布(Normal Distribution)公式为什么长这样? 和 从最小二乘法到正态分布:高斯是如何找到失踪的谷神星的? ,我们使用了 \(2\) 种不同的方法最终得到了如下公式 \((1)\) 所示的误差的概率密度函数 ( \(\text{Probability Density Function}\) ) :
\[ f(x) = \mathrm{e}^{-cx^2}, \, c > 0 \tag{1} \label{1} \]
其函数图像如下图 1 所示的钟形曲线 ( \(\text{Bell Curve}\) ) :
在概率论中,我们需要保证上图 1 中 \(f(x)\) 和 \(x\) 轴围成的面积是 \(1\) , 即:
\[ \int_{- \infty}^{+ \infty} f(x) \mathrm{d}x = 1 \tag{2} \label{2} \]
最终我们得到了正态分布 ( \(\text{Normal Distribution}\) ) 的公式如下所示:
\[ f(x) = {\frac {1}{\sigma {\sqrt {2 \pi }}}}\;e^{-{\frac {\left(x - \mu \right)^{2}}{2 \sigma ^{2}}}} \tag{3} \label{3} \]
上式中有一个 \(\pi\) ,用费曼( \(\text{Richard Feynman}\) )的话来说,当我们看到一个公式中存在 \(\pi\) 时,我们都要问自己“Where is the cycle?”。我们知道公式 \(\eqref{3}\) 中的归一化系数 \(\dfrac {1}{\sigma {\sqrt {2 \pi }}}\) 是为了保证 \(f(x)\) 下的面积为 \(1\) ,出现 \(\pi\) 是因为高斯积分 ( \(\text{Gaussian Integral}\) ) 的结果为 \(\sqrt{\pi}\) 。
那么什么是高斯积分呢?高斯积分和圆有什么关系呢?
什么是高斯积分?
高斯积分是数学王子高斯 ( \(\text{Carl Friedrich Gauss}\) ) 名字命名,和正态分布密切相关,对高斯函数 ( \(\text{Gauss function}\) ) ,也就是正态分布的概率密度函数在整个实数域进行积分,即 \(\int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x}\) ,如下图 2 所示:
初看 \(\int e^{-x^2} \mathrm{d}{x}\) ,你可能会觉得用分部积分可以求解原函数吧!一顿操作猛如虎之后,发现根本就计算不出来。
因为高斯积分在初等函数范围内是不可积的,其原函数无法用初等函数来表示,如下公式所示:
\[ F(x) = \int_{0}^{x} e^{-t^2} \mathrm{d}t \tag{4} \label{4} \]
好在早有天才数学家用天才的解法得到了高斯积分的值为 \(\sqrt{\pi}\) ,如下图 4 所示:
\[ \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} = \sqrt{\pi} \tag{5} \label{5} \]
高斯积分看起来和圆没有任何关系,但结果中却出现了 \(\pi\) ,那圆在哪里呢?
求解高斯积分有很多种解法,均来自天才数学家的天才想法。这里我们将介绍 \(3\) 种方法,第一种是常见的直角坐标系转为极坐标系法,另外 \(2\) 种来自 3Blue1Brown 的视频 Why π is in the normal distribution (beyond integral tricks) ,都非常优雅且直观,下面就让我们沉浸在数学的海洋里吧,感受数学的美!
极坐标系法
我们设 \(I\) 表示高斯积分的值:
\[ I = \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \tag{6} \label{6} \]
因为定积分是一个数,与被积函数的自变量无关,简单换下元则有:
\[ I = \int_{-\infty}^{+\infty} \mathrm{e} ^{-y^2} \,\mathrm{d}{y} \tag{7} \label{7} \]
二者相乘,则对高斯积分进行了升维,得到 \(I^2\) :
\[ \begin{aligned} I^2 & = \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \int_{-\infty}^{+\infty} \mathrm{e} ^{-y^2} \,\mathrm{d}{y} \\ & = \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} \mathrm{e} ^{-(x^2 + y^2)} \,\mathrm{d}{x} \,\mathrm{d}{y} \end{aligned} \]
转换坐标系
下面我们从直角坐标系 ( \(\text{Cartesian coordinates}\) ) 转换为极坐标系 ( \(\text{Polar coordinates}\) ) ,则有:
\[ \begin{cases} x = r \cos \theta \\ y = r \sin \theta \end{cases} \]
在直角坐标系中,我们的积分区域是:
\[ \begin{cases} -\infty < x < \infty \\ -\infty < y < \infty \end{cases} \]
转换为极坐标系之后,积分区域变为:
\[ \begin{cases} 0< r < \infty \\ 0< \theta < 2 \pi \end{cases} \]
为什么 \(\mathrm{d}x \mathrm{d}y = r \mathrm{d}r\mathrm{d}\theta\) ?
在直角坐标系中,面积微元 \(\mathrm{d} \sigma = \mathrm{d}x \mathrm{d}y\) ,而在极坐标系中,其面积微元如下图 7 所示:
计算其面积:
\[ \begin{aligned} \mathrm{d} \sigma & = \frac{1}{2}\left(r + \mathrm{d}r \right)^2\cdot \mathrm{d}\theta - \frac{1}{2}r^2\cdot \mathrm{d}\theta \\ & = \frac{1}{2}\left[r^2 + 2r \mathrm{d}r + \left(\mathrm{d} r\right)^2-r^2\right] \mathrm{d}\theta \\ & = \frac{1}{2}\left[2r \mathrm{d} r + \left(\mathrm{d} r \right)^2 \right] \cdot \mathrm{d}\theta \end{aligned} \]
因为 \((\mathrm{d}r)^2\) 是 \(2r\mathrm{d}r\) 的高阶无穷小,故有:
\[ \mathrm{d} \sigma = \frac{1}{2}(2r \mathrm{d}r) \mathrm{d}\theta = r \mathrm{d}r \mathrm{d}\theta \]
所以:
\[ \mathrm{d}x \mathrm{d}y = r \mathrm{d}r\mathrm{d}\theta \]
求解积分
在极坐标系中, \(r^2 = x^2 + y^2\) ,则有:
\[ \begin{aligned} I^2 & = \int_0^{2\pi} \int_0^{+\infty} \mathrm{e} ^{-r^2} r \,\mathrm{d}{r} \,\mathrm{d}{\theta} \\ & = \int_{\theta = 0}^{2\pi} \mathrm{d}{\theta} \int_{r=0}^{\infty} \mathrm{e} ^{-r^2} r \,\mathrm{d}{r} \\ & = 2 \pi \int_0^{+\infty} r \mathrm{e} ^{-r^2} \,\mathrm{d}{r} \end{aligned} \]
令 \(u = r^2\) ,则有:
\[ \mathrm{d}u = 2r \mathrm{d}{r} \]
\[ r \mathrm{d}r = \frac{1}{2}\mathrm{d}u \]
根据微积分基本定理易得:
\[ \begin{aligned} I^2 & = \pi \int_0^{+\infty} \mathrm{e} ^{-u} \,\mathrm{d}{u} \\ & = \pi \left (-\mathrm{e} ^{-u}) \right\rvert _0^{+\infty} \\ & = \pi \end{aligned} \]
开方,最终我们求出了高斯积分的值:
\[ I = \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} = \sqrt{\pi} \]
3D 钟形曲面下的体积
转换为极坐标法是常用的求高斯积分的方法,尤其是对高斯积分升维更是神来之笔,那么升维之后的高斯函数是什么样的呢?
\(1\) 维的高斯函数为:
\[ f_1(x) = \mathrm{e}^{-x^2} \]
那么 \(2\) 维的高斯函数则为:
\[ f_2(x, y) = \mathrm{e}^{-x^2} \mathrm{e}^{-y^2} = \mathrm{e}^{- (x^2 + y^2)} \]
\(1\) 维的高斯函数表现为钟形曲线, \(2\) 维的高斯函数则是 \(1\) 维的高斯函数沿着 \(z\) 轴旋转,如下图 8 所示:
钟形曲线绕 \(z\) 轴旋转一周会形成 \(3\) 维的钟形曲面,如下图 9 所示:
对于钟形曲面上的任意点 \(P(x, y)\) ,其距离 z 轴的距离 \(r = x^2 + y^2\) , 如下图 10 所示:
很明显, \(3\) 维钟形曲面满足径向对称性,到了这里圆出现了!
\(2\) 维的高斯函数表达式也可以写成:
\[ f_2(x, y) = \mathrm{e}^{-r^2} \]
求解 \(2\) 维的高斯函数,很明显就是求解这个 \(3\) 维钟形体积。考虑如下图 12 所示的同心圆筒,其周长为 \(2 \pi r\) ,高为 \(\mathrm{e}^{-r^2}\) ,厚度为 \(\mathrm{d}r\) ,则其体积为:
\[ \mathrm{d}V = 2 \pi r \mathrm{e}^{-r^2}\mathrm{d}r \]
对其积分可得:
\[ \begin{aligned} \mathbb{V} & = \int_0^{+\infty} \mathrm{d}V \\ & = \int_0^{+\infty} 2 \pi r \mathrm{e}^{-r^2}\mathrm{d}r \\ & = \pi \int_0^{+\infty} 2r \mathrm{e}^{-r^2}\mathrm{d}r \\ & = \pi \left (-e^{-\infty^2} -(-e^0) \right ) \\ & = \pi \end{aligned} \]
沿着 \(y\) 轴方向进行切片
我们通过对高斯积分进行升维得到了一个 \(2\) 维高斯曲面,如果我们沿着平行 \(y\) 轴方向对其进行切片,如下图 13 所示:
我们可以得到了一系列切片,而每个切片都是钟形曲线,如下图 14 所示就是 \(y = 0\) 时形成的钟形曲线,此时就是:
\[ f_2(x, y) = \mathrm{e}^{-x^2} \mathrm{e}^{-y^2} = \mathrm{e}^{-x^2} \]
而所有的切片都可以理解为钟形曲线乘以某个比例常数进行放缩,如下图 15 所示:
那么每个切片的面积就是:
\[ S = \mathrm{e}^{-x^2} \int_{-\infty}^{+\infty} \mathrm{e} ^{-y^2} \,\mathrm{d}{y} \]
每个切片的体积微元则为:
\[ \mathrm{d}V = \mathrm{e}^{-y^2} \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \]
对体积进行积分则可得:
\[ \mathbb{V} = \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \int_{-\infty}^{+\infty} \mathrm{e} ^{-y^2} \,\mathrm{d}{y} \]
由于 \(x\) 和 \(y\) 轴的对称性,易得:
\[ \mathbb{V} = \left ( \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \right )^2 \]
而我们已经知道体积 \(\mathbb{V} = \pi\) ,所以:
\[ \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} = \sqrt {\pi} \]
总结
高斯积分是最美积分之一,其结果是出人意料的 \(\sqrt {\pi}\) ,而 \(\pi\) 正是来自旋转对称性。通过之前的文章我们知道满足旋转对称性和各方向互相独立 \(2\) 个性质可以推导出正态分布,在 \(2\) 维钟形曲线等概率事件是在同一等高线形成的圆上,这就是圆的由来。