数学之美:几何视角下的高斯积分(Gaussian Integral)

By Long Luo

从之前的文章 正态分布(Normal Distribution)公式为什么长这样?从最小二乘法到正态分布:高斯是如何找到失踪的谷神星的? ,我们使用了 \(2\) 种不同的方法最终得到了如下公式 \((1)\) 所示的误差的概率密度函数 ( \(\text{Probability Density Function}\) ) :

\[ f(x) = \mathrm{e}^{-cx^2}, \, c > 0 \tag{1} \label{1} \]

其函数图像如下图 1 所示的钟形曲线 ( \(\text{Bell Curve}\) ) :

图1. 钟形曲曲线

在概率论中,我们需要保证上图 1 中 \(f(x)\)\(x\) 轴围成的面积是 \(1\) , 即:

\[ \int_{- \infty}^{+ \infty} f(x) \mathrm{d}x = 1 \tag{2} \label{2} \]

最终我们得到了正态分布 ( \(\text{Normal Distribution}\) ) 的公式如下所示:

\[ f(x) = {\frac {1}{\sigma {\sqrt {2 \pi }}}}\;e^{-{\frac {\left(x - \mu \right)^{2}}{2 \sigma ^{2}}}} \tag{3} \label{3} \]

上式中有一个 \(\pi\) ,用费曼( \(\text{Richard Feynman}\) )的话来说,当我们看到一个公式中存在 \(\pi\) 时,我们都要问自己“Where is the cycle?”。我们知道公式 \(\eqref{3}\) 中的归一化系数 \(\dfrac {1}{\sigma {\sqrt {2 \pi }}}\) 是为了保证 \(f(x)\) 下的面积为 \(1\) ,出现 \(\pi\) 是因为高斯积分 ( \(\text{Gaussian Integral}\) ) 的结果为 \(\sqrt{\pi}\)

那么什么是高斯积分呢?高斯积分和圆有什么关系呢?

什么是高斯积分?

高斯积分是数学王子高斯 ( \(\text{Carl Friedrich Gauss}\) ) 名字命名,和正态分布密切相关,对高斯函数 ( \(\text{Gauss function}\) ) ,也就是正态分布的概率密度函数在整个实数域进行积分,即 \(\int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x}\) ,如下图 2 所示:

图2. 高斯积分 ( \text{ Gaussian Integral} )

初看 \(\int e^{-x^2} \mathrm{d}{x}\) ,你可能会觉得用分部积分可以求解原函数吧!一顿操作猛如虎之后,发现根本就计算不出来。

图3. 高斯积分的原函数

因为高斯积分在初等函数范围内是不可积的,其原函数无法用初等函数来表示,如下公式所示:

\[ F(x) = \int_{0}^{x} e^{-t^2} \mathrm{d}t \tag{4} \label{4} \]

好在早有天才数学家用天才的解法得到了高斯积分的值为 \(\sqrt{\pi}\) ,如下图 4 所示:

\[ \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} = \sqrt{\pi} \tag{5} \label{5} \]

图4. 高斯积分的值

高斯积分看起来和没有任何关系,但结果中却出现了 \(\pi\) ,那圆在哪里呢?

求解高斯积分有很多种解法,均来自天才数学家的天才想法。这里我们将介绍 \(3\) 种方法,第一种是常见的直角坐标系转为极坐标系法,另外 \(2\) 种来自 3Blue1Brown 的视频 Why π is in the normal distribution (beyond integral tricks) ,都非常优雅且直观,下面就让我们沉浸在数学的海洋里吧,感受数学的美!

极坐标系法

我们设 \(I\) 表示高斯积分的值:

\[ I = \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \tag{6} \label{6} \]

因为定积分是一个数,与被积函数的自变量无关,简单换下元则有:

\[ I = \int_{-\infty}^{+\infty} \mathrm{e} ^{-y^2} \,\mathrm{d}{y} \tag{7} \label{7} \]

二者相乘,则对高斯积分进行了升维,得到 \(I^2\)

\[ \begin{aligned} I^2 & = \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \int_{-\infty}^{+\infty} \mathrm{e} ^{-y^2} \,\mathrm{d}{y} \\ & = \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} \mathrm{e} ^{-(x^2 + y^2)} \,\mathrm{d}{x} \,\mathrm{d}{y} \end{aligned} \]

转换坐标系

下面我们从直角坐标系 ( \(\text{Cartesian coordinates}\) ) 转换为极坐标系 ( \(\text{Polar coordinates}\) ) ,则有:

\[ \begin{cases} x = r \cos \theta \\ y = r \sin \theta \end{cases} \]

在直角坐标系中,我们的积分区域是:

\[ \begin{cases} -\infty < x < \infty \\ -\infty < y < \infty \end{cases} \]

图5. 笛卡尔坐标系

转换为极坐标系之后,积分区域变为:

图6. 极坐标系

\[ \begin{cases} 0< r < \infty \\ 0< \theta < 2 \pi \end{cases} \]

为什么 \(\mathrm{d}x \mathrm{d}y = r \mathrm{d}r\mathrm{d}\theta\)

在直角坐标系中,面积微元 \(\mathrm{d} \sigma = \mathrm{d}x \mathrm{d}y\) ,而在极坐标系中,其面积微元如下图 7 所示:

图7. 极坐标系中的无穷小

计算其面积:

\[ \begin{aligned} \mathrm{d} \sigma & = \frac{1}{2}\left(r + \mathrm{d}r \right)^2\cdot \mathrm{d}\theta - \frac{1}{2}r^2\cdot \mathrm{d}\theta \\ & = \frac{1}{2}\left[r^2 + 2r \mathrm{d}r + \left(\mathrm{d} r\right)^2-r^2\right] \mathrm{d}\theta \\ & = \frac{1}{2}\left[2r \mathrm{d} r + \left(\mathrm{d} r \right)^2 \right] \cdot \mathrm{d}\theta \end{aligned} \]

因为 \((\mathrm{d}r)^2\)\(2r\mathrm{d}r\) 的高阶无穷小,故有:

\[ \mathrm{d} \sigma = \frac{1}{2}(2r \mathrm{d}r) \mathrm{d}\theta = r \mathrm{d}r \mathrm{d}\theta \]

所以:

\[ \mathrm{d}x \mathrm{d}y = r \mathrm{d}r\mathrm{d}\theta \]

求解积分

在极坐标系中, \(r^2 = x^2 + y^2\) ,则有:

\[ \begin{aligned} I^2 & = \int_0^{2\pi} \int_0^{+\infty} \mathrm{e} ^{-r^2} r \,\mathrm{d}{r} \,\mathrm{d}{\theta} \\ & = \int_{\theta = 0}^{2\pi} \mathrm{d}{\theta} \int_{r=0}^{\infty} \mathrm{e} ^{-r^2} r \,\mathrm{d}{r} \\ & = 2 \pi \int_0^{+\infty} r \mathrm{e} ^{-r^2} \,\mathrm{d}{r} \end{aligned} \]

\(u = r^2\) ,则有:

\[ \mathrm{d}u = 2r \mathrm{d}{r} \]

\[ r \mathrm{d}r = \frac{1}{2}\mathrm{d}u \]

根据微积分基本定理易得:

\[ \begin{aligned} I^2 & = \pi \int_0^{+\infty} \mathrm{e} ^{-u} \,\mathrm{d}{u} \\ & = \pi \left (-\mathrm{e} ^{-u}) \right\rvert _0^{+\infty} \\ & = \pi \end{aligned} \]

开方,最终我们求出了高斯积分的值:

\[ I = \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} = \sqrt{\pi} \]

3D 钟形曲面下的体积

转换为极坐标法是常用的求高斯积分的方法,尤其是对高斯积分升维更是神来之笔,那么升维之后的高斯函数是什么样的呢?

\(1\) 维的高斯函数为:

\[ f_1(x) = \mathrm{e}^{-x^2} \]

那么 \(2\) 维的高斯函数则为:

\[ f_2(x, y) = \mathrm{e}^{-x^2} \mathrm{e}^{-y^2} = \mathrm{e}^{- (x^2 + y^2)} \]

\(1\) 维的高斯函数表现为钟形曲线, \(2\) 维的高斯函数则是 \(1\) 维的高斯函数沿着 \(z\) 轴旋转,如下图 8 所示:

图8. 钟形曲线沿 z 轴旋转

钟形曲线绕 \(z\) 轴旋转一周会形成 \(3\) 维的钟形曲面,如下图 9 所示:

图9. 3 维钟形曲面

对于钟形曲面上的任意点 \(P(x, y)\) ,其距离 z 轴的距离 \(r = x^2 + y^2\) , 如下图 10 所示:

图10. 钟形曲面上点 P(x, y)

很明显, \(3\) 维钟形曲面满足径向对称性,到了这里出现了!

\(2\) 维的高斯函数表达式也可以写成:

\[ f_2(x, y) = \mathrm{e}^{-r^2} \]

图11. 3 维钟形曲面满足径向对称性

求解 \(2\) 维的高斯函数,很明显就是求解这个 \(3\) 维钟形体积。考虑如下图 12 所示的同心圆筒,其周长为 \(2 \pi r\) ,高为 \(\mathrm{e}^{-r^2}\) ,厚度为 \(\mathrm{d}r\) ,则其体积为:

\[ \mathrm{d}V = 2 \pi r \mathrm{e}^{-r^2}\mathrm{d}r \]

图12. 同心圆筒体积

对其积分可得:

\[ \begin{aligned} \mathbb{V} & = \int_0^{+\infty} \mathrm{d}V \\ & = \int_0^{+\infty} 2 \pi r \mathrm{e}^{-r^2}\mathrm{d}r \\ & = \pi \int_0^{+\infty} 2r \mathrm{e}^{-r^2}\mathrm{d}r \\ & = \pi \left (-e^{-\infty^2} -(-e^0) \right ) \\ & = \pi \end{aligned} \]

沿着 \(y\) 轴方向进行切片

我们通过对高斯积分进行升维得到了一个 \(2\) 维高斯曲面,如果我们沿着平行 \(y\) 轴方向对其进行切片,如下图 13 所示:

图13. 沿着平行 y 轴方向切片

我们可以得到了一系列切片,而每个切片都是钟形曲线,如下图 14 所示就是 \(y = 0\) 时形成的钟形曲线,此时就是:

\[ f_2(x, y) = \mathrm{e}^{-x^2} \mathrm{e}^{-y^2} = \mathrm{e}^{-x^2} \]

图14. 切片是钟形曲线

而所有的切片都可以理解为钟形曲线乘以某个比例常数进行放缩,如下图 15 所示:

图15. 钟形曲线按照某个比例常数进行放缩

那么每个切片的面积就是:

\[ S = \mathrm{e}^{-x^2} \int_{-\infty}^{+\infty} \mathrm{e} ^{-y^2} \,\mathrm{d}{y} \]

每个切片的体积微元则为:

\[ \mathrm{d}V = \mathrm{e}^{-y^2} \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \]

对体积进行积分则可得:

\[ \mathbb{V} = \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \int_{-\infty}^{+\infty} \mathrm{e} ^{-y^2} \,\mathrm{d}{y} \]

由于 \(x\)\(y\) 轴的对称性,易得:

\[ \mathbb{V} = \left ( \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} \right )^2 \]

而我们已经知道体积 \(\mathbb{V} = \pi\) ,所以:

\[ \int_{-\infty}^{+\infty} \mathrm{e} ^{-x^2} \,\mathrm{d}{x} = \sqrt {\pi} \]

总结

高斯积分是最美积分之一,其结果是出人意料的 \(\sqrt {\pi}\) ,而 \(\pi\) 正是来自旋转对称性。通过之前的文章我们知道满足旋转对称性和各方向互相独立 \(2\) 个性质可以推导出正态分布,在 \(2\) 维钟形曲线等概率事件是在同一等高线形成的圆上,这就是圆的由来。

参考文献

  1. 高斯积分 Gaussian Integral
  2. 高斯函数 Gaussian function
  3. 圆周率 Pi
  4. 笛卡尔坐标系
  5. 极坐标
  6. 直角坐标与极坐标的互化中,为什么 dxdy=rdrdθ?
  7. Why π is in the normal distribution (beyond integral tricks)
  8. The Gaussian Integral, a Geometrically Annotated Proof