概念及其介绍
并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题。
并查集的思想是用一个数组表示了整片森林(parent),树的根节点唯一标识了一个集合,我们只要找到了某个元素的的树根,就能确定它在哪个集合里。
基本操作
- 将两个集合合并
- 询问两个元素是否在一个集合当中
基本原理:每个集合用一棵树来表示。树根的编号就是整个集合的编号。每个节点储存它的父节点,$p[x]$ 表示 $x$ 的父节点。
具体实现
初始时,每个数都是一个独立的集合,并且都是等于自己本身下标的数,当出现合并操作时,我们将两个区间合并。查询时,判断树根的编号是否相等即可。
问题 1:如何判断树根:
if(p[x] == x)
问题 2:如何求 x 的集合编号:
while(p[x] != x) x = p[x];
问题 3:如何合并两个集合:
$p[x]$ 是 $x$ 的集合编号,$p[y]$ 是 $y$ 的集合编号。把 $p[x]$(即 $x$ 的集合编号)变成 $y$ 即可:
p[x] = y
为什么要优化
我们先来看一下常规并查集的代码:
int find(int x)
{
//if(p[x] != x) p[x] = find(p[x]);
while (p[x] != x) x = p[x];
return p[x];
}
对于每一次查询操作,都需要从当前节点走到根节点,最坏情况下的时间复杂度是 $O(n^2)$ 的,会 TLE 的。
路径压缩优化
并查集里的 $find()$ 函数里可以进行路径压缩,是为了更快速的查找一个点的根节点。
如果一个节点 $x$ 费尽千辛万苦终于找到了它的祖宗节点(根节点),那么吧这条路径上的所有点都指向这个集合的根节点,这样的优化叫做路径压缩。
代码实现
int p[N]; //存储每个点的祖宗节点
// 返回 x 的祖宗节点 + 路径压缩
int find(int x)
{
if (p[x] != x) p[x] = find(p[x]);
return p[x];
}
// 初始化,假定节点编号是 1 ~ n
for (int i = 1; i <= n; i++) p[i] = i;
// 合并 a 和 b 所在的两个集合:
p[find(a)] = find(b);
例题应用
#include <iostream>
#include <cstring>
#include <cstdio>
const int N = 100010;
int p[N], n, m; // p 是所属集合编号
int find(int x) // 返回 x 的祖宗节点 + 路径压缩
{
if (p[x] != x) p[x] = find(p[x]);
return p[x];
}
int main()
{
scanf("%d%d", &n, &m);
for (int i = 1; i <= n; i++) p[i] = i;
while (m --)
{
char op[2];
int a, b;
scanf("%s%d%d", op, &a, &b);
if (op[0] == 'M') p[find(a)] = find(b);
else
{
if (find(a) == find(b)) puts("Yes");
else puts("No");
}
}
return 0;
}