算法并查集详解 - 竹笋 - Powered by Discuz!NT Archiver

TUhjnbcbe - 2025/1/6 21:39:00

理解算法

　　在计算机科学中，并查集是一种树型的数据结构，用于处理一些不交集（DisjointSets）的合并及查询问题。有一个联合-查找算法（union-findalgorithm）定义了两个用于此数据结构的操作：

Find：确定元素属于哪一个子集。这个确定方法就是不断向上查找找到它的根节点，它可以被用来确定两个元素是否属于同一子集。

Union：将两个子集合并成同一个集合。

　　由于支持这两种操作，一个不相交集也常被称为联合-查找数据结构（union-finddatastructure）或合并-查找集合（merge-findset）。其他的重要方法，MakeSet，用于建立单元素集合。有了这些方法，许多经典的划分问题可以被解决。

　　为了更加精确的定义这些方法，需要定义如何表示集合。一种常用的策略是为每个集合选定一个固定的元素，称为代表，以表示整个集合。接着，Find(x)返回x所属集合的代表，而Union使用两个集合的代表作为参数。

说明：左边是A，笔误！

　　上图中简单演示了并查集的两个操作，一个是FIND，一个UNION。

并查集(树)

　　并查集（树）是一种将一个集合以树形结构进行组合的数据结构，如上图所示。其中每一个节点保存着到它的父节点的引用（

　　在并查集树中，每个集合的代表即是集合的根节点。

“查找”根据其父节点的引用向根行进直到到底树根。

“联合”将两棵树合并到一起，这通过将一棵树的根连接到另一棵树的根。

　　实现这样操作的伪代码如下：

　　这是并查集树林的最基础的表示方法，这个方法不会比链表法好，这是因为创建的树可能会严重不平衡；然而，可以用两种办法优化。

优化方法一：按秩合并

　　第一种方法，称为“按秩合并”，即总是将更小的树连接至更大的树上。因为影响运行时间的是树的深度，更小的树添加到更深的树的根上将不会增加秩除非它们的秩相同。在这个算法中，术语“秩”替代了“深度”，因为同时应用了路径压缩时（见下文）秩将不会与高度相同。单元素的树的秩定义为0，当两棵秩同为r的树联合时，它们的秩r+1。只使用这个方法将使最坏的运行时间提高至每个MakeSet、Union或Find操作、。

优化后的MakeSet和Union伪代码

优化方法二：路径压缩

　　第二个优化，称为“路径压缩”，是一种在执行“查找”时扁平化树结构的方法。关键在于在路径上的每个节点都可以直接连接到根上；他们都有同样的表示方法。为了达到这样的效果，Find递归地经过树，改变每一个节点的引用到根节点。得到的树将更加扁平，为以后直接或者间接引用节点的操作加速。

这儿是Find：

　　这两种方法的优势互补，同时使用平均运行时间是一个极小的常数。

　　实际上，这是渐近最优算法：Fredman和Saks在年解释了的平均时间内可以获得任何并查集。

并查集算法-Java实现

主要操作

合并两个不相交集合

　　操作很简单：先设置一个数组(阵列)Father[x]，表示x的“父亲”的编号。那么，合并两个不相交集合的方法就是，找到其中一个集合最父亲的父亲（也就是最久远的祖先），将另外一个集合的最久远的祖先的父亲指向它。

判断两个元素是否属于同一集合

　　仍然使用上面的数组。则本操作即可转换为寻找两个元素的最久远祖先是否相同。寻找祖先可以采用递归实现，见后面的路径压缩算法。