概念及其介绍

并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题。

并查集的思想是用一个数组表示了整片森林(parent),树的根节点唯一标识了一个集合,我们只要找到了某个元素的的树根,就能确定它在哪个集合里。

基本操作

  1. 将两个集合合并
  2. 询问两个元素是否在一个集合当中
基本原理:每个集合用一棵树来表示。树根的编号就是整个集合的编号。每个节点储存它的父节点,$p[x]$ 表示 $x$ 的父节点。

具体实现

初始时,每个数都是一个独立的集合,并且都是等于自己本身下标的数,当出现合并操作时,我们将两个区间合并。查询时,判断树根的编号是否相等即可。

问题 1:如何判断树根:

if(p[x] == x)

问题 2:如何求 x 的集合编号:

while(p[x] != x) x = p[x];

问题 3:如何合并两个集合:

$p[x]$ 是 $x$ 的集合编号,$p[y]$ 是 $y$ 的集合编号。把 $p[x]$(即 $x$ 的集合编号)变成 $y$ 即可:

p[x] = y

为什么要优化

我们先来看一下常规并查集的代码:

int find(int x)
{
    //if(p[x] != x) p[x] = find(p[x]);
    while (p[x] != x) x = p[x];
    return p[x];
}

对于每一次查询操作,都需要从当前节点走到根节点,最坏情况下的时间复杂度是 $O(n^2)$ 的,会 TLE 的。

路径压缩优化

并查集里的 $find()$ 函数里可以进行路径压缩,是为了更快速的查找一个点的根节点。

如果一个节点 $x$ 费尽千辛万苦终于找到了它的祖宗节点(根节点),那么吧这条路径上的所有点都指向这个集合的根节点,这样的优化叫做路径压缩。

路径压缩

代码实现

int p[N]; //存储每个点的祖宗节点

// 返回 x 的祖宗节点 + 路径压缩
int find(int x)
{
    if (p[x] != x) p[x] = find(p[x]);
    return p[x];
}

// 初始化,假定节点编号是 1 ~ n
for (int i = 1; i <= n; i++) p[i] = i;

// 合并 a 和 b 所在的两个集合:
p[find(a)] = find(b);

例题应用

#include <iostream>
#include <cstring>
#include <cstdio>

const int N = 100010;
int p[N], n, m; // p 是所属集合编号

int find(int x) // 返回 x 的祖宗节点 + 路径压缩
{
    if (p[x] != x) p[x] = find(p[x]);
    return p[x];
}

int main()
{
    scanf("%d%d", &n, &m);
    for (int i = 1; i <= n; i++) p[i] = i;
    while (m --)
    {
        char op[2];
        int a, b;
        scanf("%s%d%d", op, &a, &b);
        if (op[0] == 'M') p[find(a)] = find(b);
        else
        {
            if (find(a) == find(b)) puts("Yes");
            else puts("No");
        }
    }
    return 0;
}
最后修改:2022 年 02 月 27 日
赠人玫瑰,手有余香。您的赞赏是对我最大的支持!