快速数论变换(Number Theoretic Transform)

发表于 2022-05-01 更新于 2025-02-14 分类于 Data Structures and Algorithms Waline：阅读次数：本文字数： 3.5k 阅读时长 ≈ 3 分钟

By Long Luo

之前的文章快速傅里叶变换(FFT)算法和快速傅里叶变换(FFT)算法的实现及优化详细介绍了 \(\textit{FFT}\) 的具体实现及其实现。

\(\textit{FFT}\) 优点很多，但缺点也很明显。例如单位复根的实部和虚部分别是一个正弦及余弦函数，有大量浮点数计算，计算量很大，而且浮点数运算产生的误差会比较大。

如果我们操作的对象都是整数的话，其实数学家已经发现了一个更好的方法：快速数论变换 \(\textit{(Number Theoretic Transform)}\) ¹。

快速数论变换(NTT)

\(\textit{FFT}\) 的本质是什么？

将卷积操作变成了乘法操作。

是什么让 \(\textit{FFT}\) 做到了 \(O(n \log n)\) 的复杂度？

是单位复根。

那有没有什么其他的东西也拥有单位根的这些性质呢？

答案当然是有的，原根² 就具有和单位根一样的性质。

所以快速数论变换 \(\textit{NTT}\) 就是以数论为基础的具有循环卷积性质的，用有限域上的单位根来取代复平面上的单位根的 \(\textit{FFT}\)。

原根

仿照单位复数根的形式，也将原根的取值看成一个圆，不过这个圆上只有有限个点，每个点表达的是模数的剩余系中的值。

在 \(\textit{FFT}\) 中，我们总共用到了单位复根的这些性质：

\(n\) 个单位复根互不相同；
\(\omega_n^k = \omega_{2n}^{2k}\)；
\(\omega_n^{k} = -\omega_n^{k+n/2}\)；
\(\omega_n^a \times \omega_n^b = \omega_n^{a+b}\)。

我们发现原根具有和单位复根一样的性质，简单证明³ ：

令 \(n\) 为大于 \(1\) 的 \(2\) 的幂，\(p\) 为素数且 \(n \mid (p-1)\)，\(g\) 为 \(p\) 的一个原根。

我们设 \(g_n = g^{\frac{p-1}{n}}\)：

\(g_n^n=g^{n \cdot \frac{p-1}{n}}=g^{p-1}\)
\(g_n^{\frac{n}{2}} = g^{\frac{p-1}{2}}\)
\(g_{an}^{ak} = g^{\frac{ak(p-1)}{an}} = g^{\frac{k(p-1)}{n}}=g_n^k\)

显然

\(g_n^n \equiv 1 \pmod p\)
\(g_n^{\frac{n}{2}} \equiv -1 \pmod p\)
\((g_n^{k+\frac{n}{2}})^2=g_n^{2k+n} \equiv g_n^{2k} \pmod p\)

证毕。

所以将 \(g_n^k\) 和 \(g_n^{k+\frac{n}2}\) 带入本质上和将 \(\omega_n^{k}\) 和 \(\omega_n^{k+\frac{n}{2}}\) 带入的操作无异。

利用 Vandermonde 矩阵性质，类似 \(\textit{NTT}\) 那样，我们可以从 \(\textit{NTT}\) 变换得到逆变换 \(\textit{INTT}\) 变换，设 \(x(n)\) 为整数序列，则有：

\(\textit{NTT}\) : \(X(m) = \sum \limits_{i=0}^{N}x(n)a^{mn} \pmod M\)

\(\textit{INTT}\) : \(X(m) = N^{-1}\sum \limits_{i=0}^{N}x(n)a^{-mn} \pmod M\)

这里 \(N^{-1}\) ，\(a^{-mn} \pmod M\) 为模意义下的乘法逆元。

当然， \(\textit{NTT}\) 也是有自己的缺点的：比如不能够处理小数的情况，以及不能够处理没有模数的情况。对于模数的选取也有一定的要求，首先是必须要有原根，其次是必须要是 \(2\) 的较高幂次的倍数。

NTT 实现

通过上面的分析，开始写代码吧:-)

\(\textit{NTT}\) 也有递归版(Recursion)和迭代版(Iteration) \(2\) 种实现：

递归版(Recursion)

const long long G = 3;
const long long G_INV = 332748118;
const long long MOD = 998244353;

vector<int> rev;

long long quickPower(long long a, long long b) {
    long long res = 1;

    while (b > 0) {
        if (b & 1) {
            res = (res * a) % MOD;
        }

        a = (a * a) % MOD;
        b >>= 1;
    }

    return res % MOD;
}

void ntt(vector<long long> &a, bool invert) {
    int n = a.size();

    if (n == 1) {
        return;
    }

    vector<long long> Pe(n / 2), Po(n / 2);

    for (int i = 0; 2 * i < n; i++) {
        Pe[i] = a[2 * i];
        Po[i] = a[2 * i + 1];
    }

    ntt(Pe, invert);
    ntt(Po, invert);

    long long wn = quickPower(invert ? G_INV : G, (MOD - 1) / n);
    long long w = 1;

    for (int i = 0; i < n / 2; i++) {
        a[i] = Pe[i] + w * Po[i] % MOD;
        a[i] = (a[i] % MOD + MOD) % MOD;
        a[i + n / 2] = Pe[i] - w * Po[i] % MOD;
        a[i + n / 2] = (a[i + n / 2] % MOD + MOD) % MOD;
        w = w * wn % MOD;
    }
}

迭代版(Iteration)

public:
    static const long long MOD = 998244353;
    static const long long G = 3;
    static const int G_INV = 332748118;
    vector<int> rev;

    long long quickPower(long long a, long long b) {
        long long res = 1;

        while (b > 0) {
            if (b & 1) {
                res = (res * a) % MOD;
            }

            a = (a * a) % MOD;
            b >>= 1;
        }

        return res % MOD;
    }

    void ntt(vector<long long> &a, bool invert = false) {
        int n = a.size();

        for (int i = 0; i < n; i++) {
            if (i < rev[i]) {
                swap(a[i], a[rev[i]]);
            }
        }

        for (int len = 2; len <= n; len <<= 1) {
            long long wlen = quickPower(invert ? G_INV : G, (MOD - 1) / len);

            for (int i = 0; i < n; i += len) {
                long long w = 1;
                for (int j = 0; j < len / 2; j++) {
                    long long u = a[i + j];
                    long long v = (w * a[i + j + len / 2]) % MOD;
                    a[i + j] = (u + v) % MOD;
                    a[i + j + len / 2] = (MOD + u - v) % MOD;
                    w = (w * wlen) % MOD;
                }
            }
        }

        if (invert) {
            long long inver = quickPower(n, MOD - 2);
            for (int i = 0; i < n; i++) {
                a[i] = (long long) a[i] * inver % MOD;
            }
        }
    }

复杂度分析

时间复杂度：\(O((m+n) \log (m+n))\)。
空间复杂度：\(O(m+n)\)。

快速数论变换(NTT)

原根

NTT 实现

递归版(Recursion)

迭代版(Iteration)

复杂度分析

参考资料