本地源文件：docs/math__bit.md

位操作

位操作指的是对整数二进制表示的一元和二元操作，分为 位运算 和移位两类．位操作是 CPU 中最基础的一类运算，其速度往往是相当快的．

整数与位序列

我们将只由 0 或 1 构成的长度固定的序列称为位序列．最左边的位称为最高位，最右边的位称为最低位．

计算机中用位序列表示一定范围内的整数．长度为 𝑁N 的位序列只有 2𝑁2N 种，所以只能和 2𝑁2N 个整数建立一一对应关系．这种一一对应关系可以分为两类：有符号 和 无符号 ．有符号指的是对应的整数有负数，无符号指的是对应的整数全部为非负数．

对于无符号的对应关系，我们可以直接将整数的二进制表示作为位序列，长度不足就在高位补 0．

在无符号的对应关系下，长度为 𝑁N 的位序列可以表示 [0,2𝑁 −1][0,2N−1] 内的整数．

对于有符号的对应关系，我们有两种表示规则：反码（ones' complement）和补码（two's complement）．

对于非负整数来说，其表示规则和无符号的规则一致；对于负整数来说，我们将其相反数对应的位序列 按位取反 （即将 0 变为 1，将 1 变为 0）后的结果称为反码，将反码按无符号的对应关系转为整数，然后加一，最后按无符号的对应关系转为位序列，超出原位序列长度的部分舍弃，得到的新序列称为补码．

在反码的对应关系下，长度为 𝑁N 的位序列可以表示 [ −2𝑁−1 +1,2𝑁−1 −1][−2N−1+1,2N−1−1] 内的整数．

在补码的对应关系下，长度为 𝑁N 的位序列可以表示 [ −2𝑁−1,2𝑁−1 −1][−2N−1,2N−1−1] 内的整数．

以 33 位的位序列为例：

位序列	无符号整数	有符号整数（反码）	有符号整数（补码）
`000`	00	00	00
`001`	11	11	11
`010`	22	22	22
`011`	33	33	33
`100`	44	−3−3	−4−4
`101`	55	−2−2	−3−3
`110`	66	−1−1	−2−2
`111`	77	−0−0	−1−1

可以看到反码的最大问题是会出现 −0−0 这个实际上不存在的「负数」，所以一般情况下我们只用补码．由于表示有符号整数时，其正负号仅由位序列的最高位决定，所以我们将这一位称为 符号位 ．

将位序列转为整数也是容易做到的：对非负数来说不需要特别操作，对反码来说取反即可得到对应的相反数，对补码来说取反加一即可得到对应的相反数．

位运算

位运算指的是对位序列逐位应用某些布尔函数的运算．形式化地说，对布尔函数 𝑓 :𝐁𝑘 →𝐁f:Bk→B，位运算即为形如

𝐹:(𝐁𝑚)𝑘→𝐁𝑚((𝑝1,1,…,𝑝𝑚,1),…,(𝑝1,𝑘,…,𝑝𝑚,𝑘))↦(𝑓(𝑝1,1,…,𝑝1,𝑘),…,𝑓(𝑝𝑚,1,…,𝑝𝑚,𝑘))F:(Bm)k→Bm((p1,1,…,pm,1),…,(p1,k,…,pm,k))↦(f(p1,1,…,p1,k),…,f(pm,1,…,pm,k))

的函数，其中 𝑚m 为位序列的长度．同样的，我们一般只研究一元和二元的位运算．如无特殊说明，下文的位运算仅限于一元和二元的情况．

一般来说，我们把 按位取反 、按位与 、按位或 、按位异或 视作基本的位运算，其余的位运算均可以通过这些运算组合得到．

位运算	数学符号表示	对应的布尔函数	C++ 运算符	解释
按位取反	NOTNOT	¬¬	`~`	00 变为 11，11 变为 00
按位与	ANDAND	∧∧	`&`	只有两个对应位都为 11 时才为 11

按位或| OROR| ∨∨| || 只要两个对应位中有一个 11 时就为 11 按位异或| ⊕⊕、XORXOR| ⊕⊕| ^| 只有两个对应位不同时才为 11 Warning

注意区分位运算与布尔函数．

例如：

NOT⁡01010111 =10101000NOT⁡01010111=10101000，
01010011AND⁡00110010 =0001001001010011AND⁡00110010=00010010，
01010011OR⁡00110010 =0111001101010011OR⁡00110010=01110011，
01010011XOR⁡00110010 =0110000101010011XOR⁡00110010=01100001．

由于上述四种位运算在运算时，各个位的运算独立，所以这四种位运算能直接继承其对应布尔函数的性质．

为方便起见，在位序列长度已知时，我们也可以直接对整数做位运算，例如：

NOT⁡5=−6,NOT⁡(−5)=4,5AND⁡6=4,5OR⁡6=7,5XOR⁡6=3.NOT⁡5=−6,NOT⁡(−5)=4,5AND⁡6=4,5OR⁡6=7,5XOR⁡6=3.

假设 𝑥,𝑦 ≥0x,y≥0，我们也可以将位运算用求和的方式表示：

NOT⁡𝑥=⌊log2⁡𝑥⌋∑𝑛=02𝑛((⌊𝑥2𝑛⌋mod2+1)mod2)=⌊log2⁡𝑥⌋∑𝑛=0(2⌊log2⁡𝑥⌋+1−1−𝑥)𝑥AND⁡𝑦=⌊log2⁡max{𝑥,𝑦}⌋∑𝑛=02𝑛(⌊𝑥2𝑛⌋mod2)(⌊𝑦2𝑛⌋mod2)𝑥OR⁡𝑦=⌊log2⁡max{𝑥,𝑦}⌋∑𝑛=02𝑛((⌊𝑥2𝑛⌋mod2)+(⌊𝑦2𝑛⌋mod2)−(⌊𝑥2𝑛⌋mod2)(⌊𝑦2𝑛⌋mod2))𝑥XOR⁡𝑦=⌊log2⁡max{𝑥,𝑦}⌋∑𝑛=02𝑛(((⌊𝑥2𝑛⌋mod2)+(⌊𝑦2𝑛⌋mod2))mod2)=⌊log2⁡max{𝑥,𝑦}⌋∑𝑛=02𝑛((⌊𝑥2𝑛⌋+⌊𝑦2𝑛⌋)mod2)NOT⁡x=∑n=0⌊log2⁡x⌋2n((⌊x2n⌋mod2+1)mod2)=∑n=0⌊log2⁡x⌋(2⌊log2⁡x⌋+1−1−x)xAND⁡y=∑n=0⌊log2⁡max{x,y}⌋2n(⌊x2n⌋mod2)(⌊y2n⌋mod2)xOR⁡y=∑n=0⌊log2⁡max{x,y}⌋2n((⌊x2n⌋mod2)+(⌊y2n⌋mod2)−(⌊x2n⌋mod2)(⌊y2n⌋mod2))xXOR⁡y=∑n=0⌊log2⁡max{x,y}⌋2n(((⌊x2n⌋mod2)+(⌊y2n⌋mod2))mod2)=∑n=0⌊log2⁡max{x,y}⌋2n((⌊x2n⌋+⌊y2n⌋)mod2)

在不引起歧义的情况下，下文中省略「按位」．

移位

另请参阅：C++ 位操作符．

移位为一类将位序列「按位向左或向右移动」的二元运算，第一个参数为位序列，第二个参数一般为非负整数．向左移动称为左移，向右移动称为右移．根据对移动后的空位填充方式，可将移位操作分为 算术移位 、逻辑移位 、循环移位 ．其中

逻辑移位用 0 填充空位，
算术右移用符号位填充空位，算术左移和逻辑左移相同，
循环移位用溢出位填充空位．

例如对 88 位的位序列 10 01 01 10：

操作	结果
算术左移 22 位	`01 01 10 00`
算术右移 22 位	`11 10 01 01`
逻辑左移 22 位	`01 01 10 00`
逻辑右移 22 位	`00 10 01 01`
循环左移 22 位	`01 01 10 10`
循环右移 22 位	`10 10 01 01`

在 C++ 中，我们用 a << b 表示左移，a >> b 表示右移，具体采用何种移位规则参见 C++ 位操作符．

我们可以用如下代码实现循环移位：

实现

---|---

## 位操作的应用

位操作一般有三种作用：

  1. 高效地进行某些运算，代替其它低效的方式．参见 [编译优化 #强度削减](../../lang/optimizations/#强度削减-strength-reduction)．
  2. [表示集合](../binary-set/)（常用于 [状压 DP](../../dp/state/)）．
  3. 题目本来就要求进行位操作．

需要注意的是，用位操作代替其它运算方式在很多时候并不能带来太大的优化，反而会使代码变得复杂，使用时需要斟酌．

### 有关 2 的幂的应用

由于位操作针对的是二进制表示，因此可以推广出许多与 2 的整数次幂有关的应用．

将一个数乘（除）2 的非负整数次幂：

C++Python

---|---

---|---

Warning

我们平常写的除法是向 00![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 取整，而这里的右移是向下取整（注意这里的区别），即当数大于等于 00![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 时两种方法等价，当数小于 00![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 时会有区别，如：`-1 / 2` 的值为 00![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)，而 `-1 >> 1` 的值为 −1−1![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)．

### 取绝对值

在某些机器上，效率比 `n > 0 ? n : -n` 高．

C++Python

---|---

---|---

### 取两个数的最大/最小值

在某些机器上，效率比 `a > b ? a : b` 高．

C++Python

---|---

---|---

### 判断两非零数符号是否相同

C++Python

---|---

---|---

### 交换两个数

该方法具有局限性

这种方式只能用来交换两个整数，使用范围有限．

对于一般情况下的交换操作，推荐直接调用 `algorithm` 库中的 `std::swap` 函数．

---|---

操作一个数的二进制位

获取一个数二进制的某一位：

C++Python

---|---

---|---

将一个数二进制的某一位设置为 00：

C++Python

---|---

---|---

将一个数二进制的某一位设置为 11：

C++Python

---|---

---|---

将一个数二进制的某一位取反：

C++Python

---|---

---|---

这些操作相当于将一个 3232 位整型变量当作一个长度为 3232 的布尔数组．

汉明权重

汉明权重是一串符号中不同于（定义在其所使用的字符集上的）零符号（zero-symbol）的个数．对于一个二进制数，它的汉明权重就等于它 11 的个数（即 popcount）．

求一个数的汉明权重可以循环求解：我们不断地去掉这个数在二进制下的最后一位（即右移 11 位），维护一个答案变量，在除的过程中根据最低位是否为 11 更新答案．

代码如下：

---|---

求一个数的汉明权重还可以使用 `lowbit` 操作：我们将这个数不断地减去它的 `lowbit`1，直到这个数变为 00![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)．

代码如下：

---|---

构造汉明权重递增的排列

在状压 DP 中，按照 popcount 递增的顺序枚举有时可以避免重复枚举状态．这是构造汉明权重递增的排列的一大作用．

下面我们来具体探究如何在 𝑂(𝑛)O(n) 时间内构造汉明权重递增的排列．

我们知道，一个汉明权重为 𝑛n 的最小的整数为 2𝑛 −12n−1．只要可以在常数时间构造出一个整数汉明权重相等的后继，我们就可以通过枚举汉明权重，从 2𝑛 −12n−1 开始不断寻找下一个数的方式，在 𝑂(𝑛)O(n) 时间内构造出 0 ∼𝑛0∼n 的符合要求的排列．

而找出一个数 𝑥x 汉明权重相等的后继有这样的思路，以 (10110)2(10110)2 为例：

把 (10110)2(10110)2 最右边的 11 向左移动，如果不能移动，移动它左边的 11，以此类推，得到 (11010)2(11010)2．

把得到的 (11010)2(11010)2 最后移动的 11 原先的位置一直到最低位的所有 11 都移到最右边．这里最后移动的 11 原来在第三位，所以最后三位 010010 要变成 001001，得到 (11001)2(11001)2．

这个过程可以用位操作优化：

---|---

  * 第一个步骤中，我们把数 𝑥x![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 加上它的 `lowbit`，在二进制表示下，就相当于把 𝑥x![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 最右边的连续一段 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 换成它左边的一个 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)．如刚才提到的二进制数 (10110)2(10110)2![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)，它在加上它的 `lowbit` 后是 (11000)2(11000)2![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)．这其实得到了我们答案的前半部分．
  * 我们接下来要把答案后面的 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 补齐，𝑡t![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 的 `lowbit` 是 𝑥x![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 最右边连续一段 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 最左边的 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 移动后的位置，而 𝑥x![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 的 `lowbit` 则是 𝑥x![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 最右边连续一段 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 最右边的位置．还是以 (10110)2(10110)2![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 为例，𝑡 =(11000)2t=(11000)2![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)，lowbit⁡(𝑡) =(01000)2lowbit⁡(t)=(01000)2![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)，lowbit⁡(𝑥) =(00010)2lowbit⁡(x)=(00010)2![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)．
  * 接下来的除法操作是这种位操作中最难理解的部分，但也是最关键的部分．我们设 **原数** 最右边连续一段 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 最高位的 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 在第 𝑟r![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 位上（位数从 00![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 开始），最低位的 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 在第 𝑙l![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 位，𝑡t![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 的 `lowbit` 等于 `1 << (r+1)`，𝑥x![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 的 `lowbit` 等于 `1 << l`，`(((t&-t)/(x&-x))>>1)` 得到的，就是 `(1<<(r+1))/(1<<l)/2 = (1<<r)/(1<<l) = 1<<(r-l)`，在二进制表示下就是 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 后面跟上 𝑟 −𝑙r−l![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 个零，零的个数正好等于连续 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 的个数减去 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)．举我们刚才的数为例，lowbit(t)/2lowbit(x) =(00100)2(00010)2 =(00010)2lowbit(t)/2lowbit(x)=(00100)2(00010)2=(00010)2![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)．把这个数减去 11![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 得到的就是我们要补全的低位，或上原来的数就可以得到答案．

所以枚举 0 ∼𝑛0∼n![](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7) 按汉明权重递增的排列的完整代码为：

---|---

其中要注意 00 的特判，因为 00 没有相同汉明权重的后继．

C++ 中的相关类与函数

GCC 内建函数

GCC 中还有一些用于位操作的内建函数：

int __builtin_ffs(int x)：返回 𝑥x 的二进制末尾最后一个 11 的位置，位置的编号从 11 开始（最低位编号为 11）．当 𝑥x 为 00 时返回 00．
int __builtin_clz(unsigned int x)：返回 𝑥x 的二进制的前导 00 的个数．当 𝑥x 为 00 时，结果未定义．
int __builtin_ctz(unsigned int x)：返回 𝑥x 的二进制末尾连续 00 的个数．当 𝑥x 为 00 时，结果未定义．
int __builtin_clrsb(int x)：当 𝑥x 的符号位为 00 时返回 𝑥x 的二进制的前导 00 的个数减一，否则返回 𝑥x 的二进制的前导 11 的个数减一．
int __builtin_popcount(unsigned int x)：返回 𝑥x 的二进制中 11 的个数．
int __builtin_parity(unsigned int x)：判断 𝑥x 的二进制中 11 个数的奇偶性．

这些函数都可以在函数名末尾添加 l 或 ll（如 __builtin_popcountll）来使参数类型变为 (unsigned)long 或 (unsigned)long long（返回值仍然是 int 类型）．例如，我们有时候希望求出一个数以二为底的对数，如果不考虑 0 的特殊情况，就相当于这个数二进制的位数 -1，而一个 N 位整数 n 的二进制表示的位数可以使用 N - __builtin_clz(n) 表示，因此 N - 1 - __builtin_clz(n) 就可以求出 n 以二为底的对数．

由于这些函数是内建函数，经过了编译器的高度优化，运行速度十分快（有些甚至只需要一条指令）．

题目推荐

Luogu P1225 黑白棋游戏

参考资料与注释

一个数二进制表示从低往高的第一个 11 连同后面的零，如 (1010)2(1010)2 的 lowbit 是 (0010)2(0010)2，详见树状数组． ↩

本页面最近更新： 2026/1/30 14:50:40，更新历史 发现错误？想一起完善？在 GitHub 上编辑此页！本页面贡献者：Ir1d, Tiphereth-A, ouuan, StudyingFather, greyqz, Link-cute, cjsoft, Marcythm, Enter-tainer, ksyx, lihaoyu1234, akakw1, Anguei, aofall, billchenchina, c-forrest, CCXXXI, Dian-Jiao, diauweb, Early0v0, flylai, Great-designer, H-J-Granger, Henry-ZHR, hhc0001, hjsjhn, iamtwz, Konano, Menci, MingqiHuang, orzAtalod, PlanariaIce, sakuragi1111, sbofgayschool, shawlleyw, Shen-Linwood, skippre, sshwy, stevenlele, TOMWT-qwq, Voileexperiments, Xeonacid, xinchengo, ylxmf2005, zhilu-tang, ZnPdCo, zryi2003 本页面的全部内容在CC BY-SA 4.0 和 SATA 协议之条款下提供，附加条款亦可能应用

位操作

整数与位序列

位运算

移位

操作一个数的二进制位

汉明权重

构造汉明权重递增的排列

C++ 中的相关类与函数

GCC 内建函数

更多位数

题目推荐

参考资料与注释