划分树
引入
划分树是一种来解决区间第 𝐾K 大的一种数据结构,其常数、理解难度都要比主席树低很多.同时,划分树紧贴「第 𝐾K
大」,所以是一种基于排序的一种数据结构.
前置知识:主席树
过程
建树
划分树的建树比较简单,但是相对于其他树来说比较复杂.
如图,每一层都有一个看似无序的数组.其实,每一个被红色标记的数字都是 要分配到左儿子的 .而分配的规则是什么?就是与 这一层的中位数 做比较,如果小于等于中位数,则分到左边,否则分到右边.但是这里要注意一下:并不是严格的 小于等于就分到左边,否则分到右边 .因为中位数可能有相同,而且与 𝑁N 的奇偶有一定关系.下面的代码展示会有一个巧妙的运用,大家可以参照代码.
我们不可能每一次都对每一层排序,这样子不说常数,就算是理论复杂度也过不去.我们想,找中位数,一次排序就够了.为什么?比如,我们求 𝑙,𝑟l,r 的中位数,其实就是在排完序过后的
num[mid].
两个关键数组:
tree[log(N),N]: 也就是树,要存下所有的值,空间复杂度 𝑂(𝑛log𝑛)O(nlogn). toleft[log(N),n]: 也就是每一层 1~i 进入左儿子的数量,这里需要理解一下,这是一个前缀和.
实现
---|---
### 查询
那我们先扯一下主席树的内容.在用主席树求区间第 𝐾K 小的时候,我们以 𝐾K 为基准,向左就向左,向右要减去向左的值,在划分树中也是这样子的.
查询难理解的,在于 **区间缩小** 这种东西.下图,查询的是 33 到 77, 那么下一层就只需要查询 22 到 33 了.当然,我们定义 [left,right][left,right] 为缩小后的区间(目标区间),[𝑙,𝑟][l,r] 还是所在节点的区间.那为什么要标出目标区间呢?因为那是 **判定答案在左边还是右边的基准** .

实现
---|---
性质
时间复杂度 : 一次查询只需要 𝑂(log𝑛)O(logn),𝑚m
次询问,就是 𝑂(𝑚log𝑛)O(mlogn)
.
空间复杂度 : 只需要存储 𝑂(𝑛log𝑛)O(nlogn) 个数字.
亲测结果:主席树 :1482ms1482ms、划分树 :889ms889ms
.(非递归,常数比较小)
划分树的应用
例题:[Luogu P3157[CQOI2011] 动态逆序对](https://www.luogu.com.cn/problem/P3157)
题意简述:给定一个 𝑛n个元素的排列(𝑛 ≤105n≤105
),有 m 次询问(𝑚 ≤5 ×104m≤5×104
),每次删去排列中的一个数,求删去这个数之后排列的逆序对个数.
这题可以使用 CDQ 在 Θ(𝑛log2𝑛)Θ(nlog2n) 的时间及 Θ(𝑛)Θ(n)
的空间内解决,并且 CDQ 的常数也很优秀.
如果这道题改为强制在线,则一般使用树状数组 + 主席树的树套树解法解决,时间复杂度为 Θ(𝑛log2𝑛)Θ(nlog2n),空间复杂度为 Θ(𝑛log2𝑛)Θ(nlog2n)
,常数略大,同样可以过此题.
而使用划分树的话就可以在 Θ(𝑛log2𝑛)Θ(nlog2n) 的时间及 Θ(𝑛log𝑛)Θ(nlogn)
的空间内在线解决本题,同时常数也比树套树解法少很多.(大致与 CDQ 相当.)
注意
为了编程实现方便,本文依照位置的中间值将大数组划分为两个小数组,即下文中的划分树相当于是归并排序的过程,而非快速排序的过程.最顶层的大数组为有序数组,最底层为原数组.
对于每一个划分树中的节点,我们称他为右节点当且仅当他在下一层会被划分到右孩子,即原数组中位置比较靠后的那些数,相似的可以定义左节点.如果在建树的过程中将最顶层排为有序的,类似于归并排序求逆序对,可以发现一个数组的逆序对个数就是在每个左节点之前的右节点的个树和.
再考虑删除操作.删除一个左节点会将整个数组的逆序对减少在他之前右结点的个数,而删除一个右节点会减少在他之后的左节点个数.那么可以考虑每次动态维护「每一个左节点之前的右结点个数」和「每一个右节点之后的左节点个数」.这可以使用树状数组简单维护.
需要注意的是,在使用树状数组维护时只能计算在划分树中同一块内的贡献,而不能跳出块.对于树状数组来说有一个较为巧妙的处理方式.
考虑划分树上每一块的下标范围肯定为 [𝑐 ×2𝑘 +1,(𝑐 +1) ×2𝑘][c×2k+1,(c+1)×2k] 的形式,列举如下(由于代码中不会涉及到划分树最底层的处理,因此只枚举到倒数第二层):
---|---
回忆一下树状数组的原理,在向上跳的时候,我们每次 `x += lowbit(x)`.如果在向上跳的时候可以保证不跳出块,就可以保证只会影响到块内元素的值.向上查询也类似.
而如果要在向上跳的同时保证不跳出块,只需要保证在跳的时候满足 𝑙𝑜𝑤𝑏𝑖𝑡(𝑥) <2𝑙𝑒𝑣lowbit(x)<2lev 即可.
而向下跳则是完全不同的处理方式.每一块的下标如果使用 0-index 表示的话,即为 [𝑐 ×2𝑘,(𝑐 +1) ×2𝑘)[c×2k,(c+1)×2k) 的形式.那么,只需将某一个下标的值右位移 k,即可得出它在哪一块中.在向下跳的时候时刻判断是否跳出块即可.
需要注意的是,按这一方法实现的树状数组会访问到的最大下标是距离 n 最近的 2 的整次幂,因此数组下标不能开 n.
由于需要在 log𝑛logn 层修改,在第 𝑘k 层修改的时间复杂度为 Θ(𝑘)Θ(k),最终时间复杂度即为 Θ(𝑛log𝑛 +𝑚log2𝑛)Θ(nlogn+mlog2n).
附代码:
---|---
后记
参考博文 :传送门.
本页面最近更新: 2026/1/7 08:56:54,更新历史 发现错误?想一起完善?在 GitHub 上编辑此页! 本页面贡献者:Ir1d, StudyingFather, H-J-Granger, CCXXXI, countercurrent-time, Enter-tainer, NachtgeistW, Tiphereth-A, Early0v0, ksyx, sshwy, AngelKitty, cjsoft, diauweb, ezoixx130, GekkaSaori, Konano, LovelyBuggies, Makkiy, mgt, minghu6, P-Y-Y, PotassiumWings, SamZhangQingChuan, shuzhouliu, Suyun514, weiyong1024, william-song-shy, Xarfa, alphagocc, aofall, CoelacanthusHex, danni, FinParker, GavinZhengOI, Gesrua, HeRaNO, iamtwz, kenlig, kxccc, lychees, Marcythm, opsiff, orzAtalod, Peanut-Tang, Persdre, r-value, SukkaW, yusancky, ZnPdCo, ZsgsDesign, zyouxam 本页面的全部内容在CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用