本地源文件：docs/math__number-theory__pollard-rho.md

分解质因数

引入

给定一个正整数 𝑁 ∈𝐍+N∈N+，试快速找到它的一个非平凡因数．

考虑朴素算法，因数是成对分布的，𝑁N 的所有因数可以被分成两块，即 [2,√𝑁][2,N] 和 [√𝑁 +1,𝑁)[N+1,N)．只需要把 [2,√𝑁][2,N] 里的数遍历一遍，再根据除法就可以找出至少两个因数了．这个方法的时间复杂度为 𝑂(√𝑁)O(N)．

当 𝑁 ≥1018N≥1018 时，这个算法的运行时间我们是无法接受的，希望有更优秀的算法．一种想法是通过随机的方法，猜测一个数是不是 𝑁N 的因数，如果运气好可以在 𝑂(1)O(1) 的时间复杂度下求解答案，但是对于 𝑁 ≥1018N≥1018 的数据，成功猜测的概率是 1101811018, 期望猜测的次数是 10181018．如果是在 [2,√𝑁][2,N] 里进行猜测，成功率会大一些．我们希望有方法来优化猜测．

朴素算法

最简单的算法即为从 [2,√𝑁][2,N] 进行遍历．

C++Python

---|---

---|---

我们能够证明 result 中的所有元素即为 N 的全体素因数．

证明 result 中即为 𝑁N 的全体素因数

首先考察 N 的变化．当循环进行到 i 结束时，由于刚执行结束 while(N % i == 0) N /= i 部分，i 不再整除 N．而且，每次除去一个因子，都能够保证 N 仍整除 𝑁N．这两点保证了，当循环进行到 i 开始时，N 是 𝑁N 的一个因子，且不被任何小于 i 的整数整除．

其次证明 result 中的元素均为 𝑁N 的因子．当循环进行到 i 时，能够在 result 中存入 i 的条件是 N % i == 0，这说明 i 整除 N，且已经说明 N 是 𝑁N 的因子，故而有 i 是 𝑁N 的因子．当对 i 的循环结束时，若 N 不为一，也会存入 result．此时它根据前文，也必然是 𝑁N 的一个因子．

其次证明 result 中均为素数．我们假设存在一个在 result 中的合数 𝐾K，则必然存在 i 不超过 √𝐾K，满足 i 是 K 的一个因子．这样的 𝐾K 不可能作为循环中的某个 i 存入 result，因为第一段已经说明，当循环到 𝐾K 时，N 不被任何小于 𝐾K 的 i 整除．这样的 𝐾K 也不可能在循环结束后加入，因为循环退出的条件是 i * i > N，故而已经遍历完了所有不超过 √𝐾K 的 i，而且据上文所说，这些 i 绝不能整除目前的 N，亦即 𝐾K．

最后证明，所有 𝑁N 的素因子必然出现在 result 中．不妨假设 𝑝p 是 𝑁N 的一个素因子，但并没有出现在 result 中．根据上文的讨论，𝑝p 不可能是循环中出现过的 i．设 i 是退出循环前最后的 i，则 i 严格小于 𝑝p，而退出循环后的 N 不被之前的 i 整除，故而 𝑝p 整除 N．所以最后的 N 大于一，则根据前文所述，它必然是素数，则 N 就等于 𝑝p，必会在最后加入 result，与假设矛盾．

值得指出的是，如果开始已经打了一个素数表的话，时间复杂度将从 𝑂(√𝑁)O(N) 下降到 𝑂(√𝑁ln⁡𝑁)O(Nln⁡N)．去筛法处查阅更多打表的信息．

例题：CF 1445C

Pollard Rho 算法

引入

利用暴力算法获得一个非平凡因子的复杂度为 𝑂(𝑝) =𝑂(√𝑁)O(p)=O(N)，这里，𝑝p 是 𝑁N 的最小素因子．而下面要介绍的 Pollard-Rho 算法是一种随机化算法，可以在 𝑂(√𝑝) =𝑂(𝑁1/4)O(p)=O(N1/4) 的期望复杂度获得一个非平凡因子（注意！非平凡因子不一定是素因子）．

它的核心想法是，对于一个随机自映射 𝑓 :ℤ𝑝 →ℤ𝑝f:Zp→Zp，从任何一点 𝑥1x1 出发，迭代计算 𝑥𝑛 =𝑓(𝑥𝑛−1)xn=f(xn−1)，将在 𝑂(√𝑝)O(p) 期望时间内进入循环．如果能够找到 𝑥𝑖 ≡𝑥𝑗(mod𝑝)xi≡xj(modp)，则 𝑝p 整除 gcd(|𝑥𝑖 −𝑥𝑗|,𝑁)gcd(|xi−xj|,N)，这一最大公约数就是 𝑁N 的一个非平凡因子．

要理解进入循环的期望时间为 𝑂(√𝑝)O(p)，可以从生日悖论中获得启发．

生日悖论

不考虑出生年份（假设每年都是 365 天），问：一个房间中至少多少人，才能使其中两个人生日相同的概率达到 50%50%?

解：假设一年有 𝑛n 天，房间中有 𝑘k 人，用整数 1,2,…,𝑘1,2,…,k 对这些人进行编号．假定每个人的生日均匀分布于 𝑛n 天之中，且两个人的生日相互独立．

设 𝑘k 个人生日互不相同为事件 𝐴A, 则事件 𝐴A 的概率为

𝑃(𝐴)=𝑘−1∏𝑖=0𝑛−𝑖𝑛P(A)=∏i=0k−1n−in

至少有两个人生日相同的概率为 𝑃(――𝐴) =1 −𝑃(𝐴)P(A―)=1−P(A)．根据题意可知 𝑃(――𝐴) ≥12P(A―)≥12, 那么就有

𝑃(𝐴)=𝑘−1∏𝑖=0𝑛−𝑖𝑛≤12P(A)=∏i=0k−1n−in≤12

由不等式 1 +𝑥 ≤e𝑥1+x≤ex 可得

𝑃(𝐴)≤𝑘−1∏𝑖=1exp⁡(−𝑖𝑛)=exp⁡(−𝑘(𝑘−1)2𝑛)P(A)≤∏i=1k−1exp⁡(−in)=exp⁡(−k(k−1)2n)

因此

exp⁡(−𝑘(𝑘−1)2𝑛)≤12⟹𝑃(𝐴)≤12exp⁡(−k(k−1)2n)≤12⟹P(A)≤12

将 𝑛 =365n=365 代入，解得 𝑘 ≥23k≥23．所以一个房间中至少 2323 人，使其中两个人生日相同的概率达到 50%50%, 但这个数学事实十分反直觉，故称之为一个悖论．

当 𝑘 >56k>56，𝑛 =365n=365 时，出现两个人同一天生日的概率将大于 99%99%1．那么在一年有 𝑛n 天的情况下，当房间中有 12(√8𝑛ln⁡2+1 +1) ≈√2𝑛ln⁡212(8nln⁡2+1+1)≈2nln⁡2 个人时，至少有两个人的生日相同的概率约为 50%50%．

类似地可以计算，随机均匀地选取一列生日，首次获得重复生日需要的人数的期望也是 𝑂(√𝑛)O(n)．设这一人数为 𝑋X，则

𝐸(𝑋)=𝑛+1∑𝑥=1𝑃(𝑋≥𝑥+1)=𝑛∑𝑥=0𝑛!(𝑛−𝑥)!𝑛𝑥=√𝜋𝑛2−13+𝑜(1).E(X)=∑x=1n+1P(X≥x+1)=∑x=0nn!(n−x)!nx=πn2−13+o(1).

这启发我们，如果可以随机选取一列数字，出现重复数字需要的抽样规模的期望也是 𝑂(√𝑛)O(n) 的．

利用最大公约数求出一个约数

实际构建一列模 𝑝p 的随机数列并不现实，因为 𝑝p 正是需要求的．所以，我们通过 𝑓(𝑥) =(𝑥2 +𝑐)mod𝑁f(x)=(x2+c)modN 来生成一个伪随机数序列 {𝑥𝑖}{xi}：随机取一个 𝑥1x1，令 𝑥2 =𝑓(𝑥1), 𝑥3 =𝑓(𝑥2), …, 𝑥𝑖 =𝑓(𝑥𝑖−1)x2=f(x1), x3=f(x2), …, xi=f(xi−1)，其中 𝑐 ∈[1,𝑁)c∈[1,N) 是一个随机选取的常数．

这里选取的函数容易计算，且往往可以生成相当随机的序列．但它并不是完全随机的．举个例子，设 𝑛 =50, 𝑐 =6, 𝑥1 =1n=50, c=6, x1=1，𝑓(𝑥)f(x) 生成的数据为

1,7,5,31,17,45,31,17,45,31,…1,7,5,31,17,45,31,17,45,31,…

可以发现数据在 𝑥4x4 以后都在 31,17,4531,17,45 之间循环．如果将这些数如下图一样排列起来，会发现这个图像酷似一个 𝜌ρ，算法也因此得名 rho．

pollard-rho

更重要的是，这样的函数确实提供了 ℤ𝑝Zp 上一个自映射．也就是说，它满足性质：如果 𝑥 ≡𝑦(mod𝑝)x≡y(modp)，则 𝑓(𝑥) ≡𝑓(𝑦)(mod𝑝)f(x)≡f(y)(modp)．

证明

若 𝑥 ≡𝑦(mod𝑝)x≡y(modp)，则 𝑥2 +𝑐 ≡𝑦2 +𝑐(mod𝑝)x2+c≡y2+c(modp)．注意到，𝑓(𝑥) =𝑥2 +𝑐 −𝑘𝑥𝑁f(x)=x2+c−kxN，这里 𝑘𝑥kx 是一个依赖于 𝑥x 的整数，且 𝑝|𝑁p|N，所以有 𝑓(𝑥) =𝑥2 +𝑐(mod𝑝)f(x)=x2+c(modp)，因而 𝑓(𝑥) =𝑓(𝑦)(mod𝑝)f(x)=f(y)(modp)．

作为 ℤ𝑝Zp 上的伪随机自映射反复迭代得到的序列，{𝑥𝑛mod𝑝}{xnmodp} 在 𝑂(√𝑝)O(p) 的期望时间内就会出现重复．只要我们观察到这样的重复 𝑥𝑖 ≡𝑥𝑗(mod𝑝)xi≡xj(modp)，就可以根据 gcd(|𝑥𝑖 −𝑥𝑗|,𝑁)gcd(|xi−xj|,N) 求出一个 𝑁N 的非平凡因子．注意到，由于 𝑝p 未知，我们并没有办法直接判断重复的发生，一个简单的判断方法正是 gcd(|𝑥𝑖 −𝑥𝑗|,𝑁)gcd(|xi−xj|,N) 严格大于一．

这一算法并不是总能成功的，因为 gcd(|𝑥𝑖 −𝑥𝑗|,𝑁)gcd(|xi−xj|,N) 可能等于 𝑁N．也就是说，𝑥𝑖 ≡𝑥𝑗(mod𝑁)xi≡xj(modN)．此时，{𝑥𝑛mod𝑝}{xnmodp} 首次发生重复时，恰好 {𝑥𝑛}{xn} 也发生重复了．我们没有得到一个非平凡因子．而且，{𝑥𝑛}{xn} 开始循环后，再继续迭代也没有意义了，因为之后只会重复这一循环．该算法应输出分解失败，需要更换 𝑓(𝑥)f(x) 中选取的 𝑐c 重新分解．

根据上文分析，理论上，任何满足 ∀𝑥 ≡𝑦(mod𝑝),𝑓(𝑥) ≡𝑓(𝑦)(mod𝑝)∀x≡y(modp),f(x)≡f(y)(modp)，且能够保证一定伪随机性的函数 𝑓(𝑥)f(x)（例如某些多项式函数）都可以用在此处．实践中，主要使用 𝑓(𝑥) =𝑥2 +𝑐 (𝑐 ≠0, −2)f(x)=x2+c (c≠0,−2)．2

实现

我们需要实现的算法，能够在迭代过程中快速判断 {𝑥𝑛mod𝑝}{xnmodp} 是否已经出现重复．将 𝑓f 看成以 ℤ𝑝Zp 为顶点的有向图上的边，我们实际要实现的是一个判环算法．只是将判等改为了判断 gcd(|𝑥𝑖 −𝑥𝑗|,𝑁)gcd(|xi−xj|,N) 是否大于一．

Floyd 判环

假设两个人在赛跑，A 的速度快，B 的速度慢，经过一定时间后，A 一定会和 B 相遇，且相遇时 A 跑过的总距离减去 B 跑过的总距离一定是圈长的倍数．

设 𝑎 =𝑓(0),𝑏 =𝑓(𝑓(0))a=f(0),b=f(f(0))，每一次更新 𝑎 =𝑓(𝑎),𝑏 =𝑓(𝑓(𝑏))a=f(a),b=f(f(b))，只要检查在更新过程中 𝑎a 和 𝑏b 是否相等，如果相等了，那么就出现了环．

我们每次令 𝑑 =gcd(|𝑥𝑖 −𝑥𝑗|,𝑁)d=gcd(|xi−xj|,N)，判断 d 是否满足 1 <𝑑 <𝑁1<d<N，若满足则可直接返回 𝑑d．如果 𝑑 =𝑁d=N，则说明 {𝑥𝑖}{xi} 已经形成环，在形成环时就不能再继续操作了，直接返回 𝑁N 本身，并且在后续操作里调整随机常数 𝑐c，重新分解．

基于 Floyd 判环的 Pollard-Rho 算法

C++Python

---|---

---|---

Brent 判环

实际上，Floyd 判环算法可以有常数上的改进．Brent 判环从 𝑘 =1k=1 开始递增 𝑘k，在第 𝑘k 轮，让 A 等在原地，B 向前移动 2𝑘2k 步，如果在过程中 B 遇到了 A，则说明已经得到环，否则让 A 瞬移到 B 的位置，然后继续下一轮．

可以证明3，这样得到环之前需要调用 𝑓f 的次数永远不大于 Floyd 判环算法．原论文中的测试表明，Brent 判环需要的平均时间相较于 Floyd 判环减少了 24%24%．

倍增优化

无论是 Floyd 判环还是 Brent 判环，迭代次数都是 𝑂(√𝑝)O(p) 的．但是每次迭代都用 gcdgcd 判断是否成环会拖慢算法运行速度．可以通过乘法累积来减少求 gcdgcd 的次数．

如果每 𝑘k 对计算一次 gcdgcd，则算法复杂度降低到 𝑂(√𝑝 +𝑘−1√𝑝log⁡𝑁)O(p+k−1plog⁡N)，这里，log⁡𝑁log⁡N 为单次计算 gcdgcd 的开销．注意到 𝑘k 和 log⁡𝑁log⁡N 大致同阶时，可以得到 𝑂(√𝑝)O(p) 的期望复杂度．具体实现中，大多选取 𝑘 =128k=128．

这里提供 Brent 判环且加上倍增优化的 Pollard-Rho 算法实现．

实现

C++Python

---|---

---|---

复杂度

Pollard-Rho 算法中的期望迭代次数为 𝑂(√𝑝)O(p)，这里 𝑝p 是 𝑁N 的最小素因子．具体实现无论是采用 Floyd 判环还是 Brent 判环，如果不使用倍增优化，期望复杂度都是 𝑂(√𝑝log⁡𝑁)O(plog⁡N)；在加上倍增优化后，可以近似得到 𝑂(√𝑝)O(p) 的期望复杂度．

值得一提的是，前文分析基于的是完全随机的自映射函数，但 Pollard-Rho 算法实际使用的是伪随机函数，所以该算法并没有严格的复杂度分析，实践中通常跑得较快．

例题：求一个数的最大素因子

例题：P4718【模板】Pollard-Rho 算法

对于一个数 𝑛n，用 Miller Rabin 算法判断是否为素数，如果是就可以直接返回了，否则用 Pollard-Rho 算法找一个因子 𝑝p，将 𝑛n 除去因子 𝑝p．再递归分解 𝑛n 和 𝑝p，用 Miller Rabin 判断是否出现质因子，并用 max_factor 更新就可以求出最大质因子了．由于这个题目的数据过于庞大，用 Floyd 判环的方法是不够的，这里采用倍增优化的方法．

实现

---|---

## 参考资料与链接

* * *

  1. <https://en.wikipedia.org/wiki/Birthday_problem#Reverse_problem> ↩

  2. Menezes, Alfred J.; van Oorschot, Paul C.; Vanstone, Scott A. (2001). Handbook of Applied Cryptography. Section 3.11 and 3.12. ↩

  3. Brent, R. P. (1980), An improved Monte Carlo factorization algorithm, BIT Numerical Mathematics, 20(2): 176–184, doi:10.1007/BF01933190 ↩

* * *

>  __本页面最近更新： 2026/1/7 08:56:54，[更新历史](https://github.com/OI-wiki/OI-wiki/commits/master/docs/math/number-theory/pollard-rho.md)
>  __发现错误？想一起完善？[在 GitHub 上编辑此页！](https://oi-wiki.org/edit-landing/?ref=/math/number-theory/pollard-rho.md "edit.link.title")
>  __本页面贡献者：[Tiphereth-A](https://github.com/Tiphereth-A), [383494](https://github.com/383494), [c-forrest](https://github.com/c-forrest), [Enter-tainer](https://github.com/Enter-tainer), [ShaoChenHeng](https://github.com/ShaoChenHeng), [StudyingFather](https://github.com/StudyingFather), [Xeonacid](https://github.com/Xeonacid), [CCXXXI](https://github.com/CCXXXI), [iamtwz](https://github.com/iamtwz), [ksyx](https://github.com/ksyx), [Menci](https://github.com/Menci), [PeterlitsZo](https://github.com/PeterlitsZo), [shuzhouliu](https://github.com/shuzhouliu), [usamoi](https://github.com/usamoi), [2740365712](https://github.com/2740365712), [Backl1ght](https://github.com/Backl1ght), [Bubbleioa](https://github.com/Bubbleioa), [GoodCoder666](https://github.com/GoodCoder666), [Great-designer](https://github.com/Great-designer), [Ir1d](https://github.com/Ir1d), [kenlig](https://github.com/kenlig), [leoleoasd](https://github.com/leoleoasd), [megakite](https://github.com/megakite), [SaisycJiang](https://github.com/SaisycJiang), [shawlleyw](https://github.com/shawlleyw), [TianKong-y](https://github.com/TianKong-y), [Watersail2005](https://github.com/Watersail2005), [xyf007](https://github.com/xyf007)
>  __本页面的全部内容在**[CC BY-SA 4.0](https://creativecommons.org/licenses/by-sa/4.0/deed.zh) 和 [SATA](https://github.com/zTrix/sata-license)** 协议之条款下提供，附加条款亦可能应用