1 算法概述
定义。按照边的权重顺序(从小到大),将边加入最小生成树中。加入的边不会与已经加入的边构成环,知道树中含有V-1条边为主。这些黑色的边逐渐由一片森林合并为一棵树,也就是最小生成树。这种计算方法被称为Kruskal算法。
命题O。Kruskal算法能够技术任意加权连通图的最小生成树。
证明:由命题K可知,如果下一条将别加入最小生成树中的边不会和已有的黑色边构成环,那么它就构成连接树中顶点和非树中顶点集合的一种切分。且它是目前已知的唯一一条横切边切按照权重顺序选择的边,所以它比如树权重最小的横切边。因此该算法能够连续选择权重最小的横切边,和贪心算法一致。
2 算法实现
数据结构:
- 边权重排序:使用临时数组,按照权重给数组排序
- 动态连通且判断新加入的边和已有的边是否成环(是否相连),使用之前学习的union-find算法。
Kruskal算法源代码2-1如下所示:
package edu.princeton.cs.algs4;
import java.util.Arrays;
/**
 *  最小生成树 Kruskal算法
 */
public class KruskalMST {
    private static final double FLOATING_POINT_EPSILON = 1E-12;
    /**
    * 最小生成树总权重
    */
    private double weight;
    /**
    * 最小生成树
    */
    private Queue<Edge> mst = new Queue<Edge>();
    /**
     * kruskal 计算最小生成树
     * @param G 加权连通图
     */
    public KruskalMST(EdgeWeightedGraph G) {
        // 边按照权重排序
        Edge[] edges = new Edge[G.E()];
        int t = 0;
        for (Edge e: G.edges()) {
            edges[t++] = e;
        }
        Arrays.sort(edges);
        // run greedy algorithm
        UF uf = new UF(G.V());
        for (int i = 0; i < G.E() && mst.size() < G.V() - 1; i++) {
            Edge e = edges[i];
            int v = e.either();
            int w = e.other(v);
            // 检测是否相连(成环)
            if (uf.find(v) != uf.find(w)) {
                // 合并顶点v和w
                uf.union(v, w);
                mst.enqueue(e);
                weight += e.weight();
            }
        }
        // check optimality conditions
        // assert check(G);
    }
    /**
     * 最小生成树中的边
     * @return 最小生成树中的边
     */
    public Iterable<Edge> edges() {
        return mst;
    }
    /**
     * 最小生成树总权重
     * @return 最小生成树总权重
     */
    public double weight() {
        return weight;
    }
    
    /**
    * 算法校验
    */
    private boolean check(EdgeWeightedGraph G) {
        // check total weight
        double total = 0.0;
        for (Edge e : edges()) {
            total += e.weight();
        }
        if (Math.abs(total - weight()) > FLOATING_POINT_EPSILON) {
            System.err.printf("Weight of edges does not equal weight(): %f vs. %f\n", total, weight());
            return false;
        }
        // check that it is acyclic
        UF uf = new UF(G.V());
        for (Edge e : edges()) {
            int v = e.either(), w = e.other(v);
            if (uf.find(v) == uf.find(w)) {
                System.err.println("Not a forest");
                return false;
            }
            uf.union(v, w);
        }
        // check that it is a spanning forest
        for (Edge e : G.edges()) {
            int v = e.either(), w = e.other(v);
            if (uf.find(v) != uf.find(w)) {
                System.err.println("Not a spanning forest");
                return false;
            }
        }
        // check that it is a minimal spanning forest (cut optimality conditions)
        for (Edge e : edges()) {
            // all edges in MST except e
            uf = new UF(G.V());
            for (Edge f : mst) {
                int x = f.either(), y = f.other(x);
                if (f != e) uf.union(x, y);
            }
            
            // check that e is min weight edge in crossing cut
            for (Edge f : G.edges()) {
                int x = f.either(), y = f.other(x);
                if (uf.find(x) != uf.find(y)) {
                    if (f.weight() < e.weight()) {
                        System.err.println("Edge " + f + " violates cut optimality conditions");
                        return false;
                    }
                }
            }
        }
        return true;
    }
}
- 边按照权重排序,书中使用了优先队列;
- 关于unino-find算法解决动态连通性问题,可以参考之前相关文章。它可以解决动态构建连通中,判断两个顶点是否相连,即是否边的两个顶点已经在最小生成树中,防止成环。
测试代码2-2如下所示:
public static void testKruskal() {
    String path = System.getProperty("user.dir") + File.separator + "asserts/tinyEWG.txt";
    In in = new In(path);
    EdgeWeightedGraph G = new EdgeWeightedGraph(in);
    KruskalMST mst = new KruskalMST(G);
    for (Edge e : mst.edges()) {
        StdOut.println(e);
    }
    StdOut.printf("%.5f\n", mst.weight());
}
测试结果:
0-7 0.16000
2-3 0.17000
1-7 0.19000
0-2 0.26000
5-7 0.28000
4-5 0.35000
6-2 0.40000
1.81000
Kruskal算法轨迹图2-1如下所示:

3 最小生成树小结
各种最小生成树算法性能特点,如下表3-1所示:
| 算法 | V个顶点E条边,最坏情况下增长数量级 | |
|---|---|---|
| 空间 | 时间 | |
| 延时Prim | E | E log  E E\log E ElogE | 
| 即时Prim | V | E log  V E\log V ElogV | 
| Kruskal | E | E log  E E\log E ElogE | 
| Fredman-Tarjan | V | E+ V log  V V\log V VlogV | 
| Chazelle | V | 接近E | 
| 理想 | V | E? | 
一方面目前还没有理论证明,不存在能在线性时间内得到任意图的最小生成树算法。另一方面在线性时间内计算稀疏图的最小生成树算法仍然没有进展。
结语
如果小伙伴什么问题或者指教,欢迎交流。
❓QQ:806797785
⭐️源代码仓库地址:https://gitee.com/gaogzhen/algorithm
参考链接:
[1][美]Robert Sedgewich,[美]Kevin Wayne著;谢路云译.算法:第4版[M].北京:人民邮电出版社,2012.10.p404-408.



![[ 应急响应篇基础 ] 日志分析工具Log Parser配合login工具使用详解(附安装教程)](https://img-blog.csdnimg.cn/6732169e2881495e8199b16c7e16864f.png)















