红黑树
由于AVL树为了保持平衡需要经常旋转,开销是很大的。因此,红黑树比起AVL树放宽了平衡的限制。
概念
红黑树,在每个节点上增加一个存储位表示节点的颜色,可以是RED或BLACK。
通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路径会比其他路径长出俩倍
因而AVL树是严格平衡,红黑树是接近平衡的

红黑树的性质
首先声明一个定义:简单路径。
从根节点走到NIL节点就是一条简单路径。(NIL节点也就是空节点)
-  
每个节点不是黑色就是红色
 -  
根节点是黑色的
 -  
如果一个节点是红色的,则它的两个孩子节点必须是黑色的
也就是说:任何路径上没有连续的红色节点
 -  
对于每个结点,从该结点到其所有后代叶结点的简单路径上,均包含相同数目的黑色结点
可以简单的认为:每条路径上黑色节点的数量相同
 -  
每个NIL节点都是黑色的
 
思考:为什么满足上面的性质,红黑树就能保证:其最长路径中节点个数不会超过最短路径节点个数的两倍?
首先要知道:红黑树中,最短路径为全黑路径,最长路径为一黑一红交替路径
再由于每条路径的黑色节点数相同,就能够保证:2*最短路径≤最长路径
红黑树的节点设计
enum Color
{
	RED,
	BLACK
};
template<class K,class V>
struct RETreeNode
{
	RETreeNode<K, V>* _parent;
	RETreeNode<K, V>* _left;
	RETreeNode<K, V>* _right;
	pair<K, V> _kv;
	Color _col;
	RETreeNode(const pair<K, V>& kv)
		:_kv(kv)
		, _parent(nullptr)
		, _left(nullptr)
		, _right(nullptr)
		, _col(RED)
	{}
};
 
插入的新结点的默认颜色应该是红色。(宁愿是违反性质三也不去违反性质四)
假设插入的是黑色节点,那么路径之间的黑节点的个数不再相同,所有路径都出现了问题
假设插入的是红节点:如果其父亲是黑节点那么一点问题都没有;如果父亲是红节点,那么也只有这一条路径有问题
红黑树的框架设计
template<class K,class V>
class RBTree
{
	typedef RETreeNode<K, V> Node;
public:
    //……
private:
 	Node* _root = nullptr;
};
 
红黑树的插入
红黑树是在二叉搜索树的基础上加上其平衡限制条件,因此红黑树的插入可分为两步:
- 按照二叉搜索的树规则插入新节点
 - 检测新节点插入后,红黑树的性质是否造到破坏
 
bool Insert(const pair<K, V>& kv),下面分布来讲:
第一步:插入节点
//如果为空,则直接新建节点插入即可
if (_root == nullptr)
{
    _root = new Node(kv);
    _root->_col = BLACK;//根节点为黑
    return true;
}
Node* cur = _root;
Node* parent = _root;
//确定插入位置
while (cur)
{
    if (cur->_kv.first > kv.first)
    {
        parent = cur;
        cur = cur->_left;
    }
    else if (cur->_kv.first < kv.first)
    {
        parent = cur;
        cur = cur->_right;
    }
    else
    {
        return false;
    }
}
//插入节点
cur = new Node(kv);
cur->_parent = parent;
if (parent->_kv.first < kv.first)
{
    parent->_right = cur;
}
else
{
    parent->_left = cur;
}
 
这里的逻辑就是二叉搜索树插入的逻辑
第二步:检测红黑树性质是否被破坏
因为新节点的默认颜色是红色,因此:
- 如果其双亲节点的颜色是黑色,没有违反红黑树任何性质,则不需要调整
 - 但当新插入节点的双亲节点颜色为红色时,就违反了性质三不能有连在一起的红色节点
 
此时需要对红黑树分情况来讨论:
约定:cur为当前节点,p为父节点,g为祖父节点,u为叔叔节点
情况一:cur为红,p为红,g为黑,u存在且为红

此处看到的树,可能是一棵完整的树,也可能是一棵子树
此外cur并不一定是新插入的节点,有可能是正好向上调整到这个节点
处理方法:
-  
p和u变黑,g变红
此时,局部子树里面,已满足红黑树的性质
 -  
继续向上处理:
- g没有父亲,即g就是根节点,那么将g变黑即可。插入完成
 - g有父亲,且父亲是黑色。那么此时插入完成
 - g有父亲,父亲是红色。将g作为cur,和刚才是相同的处理方式。
 
这里向上处理是个循环,而循环的结束条件为:g的父亲不存在或者g的父亲存在且为黑
 
情况二:cur为红,p为红,g为黑,u不存在或者u存在且为黑

u的情况有两种:
-  
如果u不存在,则cur一定是新插入的节点。因为如果不是,那么cur和p一定有一个节点为黑色,此时就不满足性质4了

 -  
如果u存在且为黑,那么cur节点原来的颜色一定是黑色。现在看到其是红色的原因是因为cur在子树调整的过程中将cur从黑色变成红色了

 
由于涉及旋转,所以需要对g、p、u的位置进行判断,以便使用对应的旋转
最终代码:
//判断是否破坏红黑树的性质
while (parent && parent->_col == RED)
{
    Node* grandfather = parent->_parent;
    if (parent == grandfather->_left)		//parent在grandfather的左边
    {
        Node* uncle = grandfather->_right;
        if (uncle && uncle->_col == RED)//uncle存在且为红
        {
            //直接变色
            parent->_col = uncle->_col = BLACK;
            grandfather->_col = RED;
            //再向上判断调整
            cur = grandfather;
            parent = cur->_parent;
        }
        else//uncle不存在或为黑
        {
            if (cur == parent->_left)		//cur在parent左侧,需要右单旋
            {
                RotateR(grandfather);
                parent->_col = BLACK;
                grandfather->_col = RED;
            }
            else//cur在parent右侧,需要左右双旋
            {
                RotateL(parent);
                RotateR(grandfather);
                cur->_col = BLACK;
                grandfather->_col = RED;
            }
            break;
        }
    }
    else//parent在grandfather的右边
    {
        Node* uncle = grandfather->_left;
        if (uncle && uncle->_col == RED)//uncle存在且为红
        {
            //直接变色
            parent->_col = uncle->_col = BLACK;
            grandfather->_col = RED;
            //再向上判断调整
            cur = grandfather;
            parent = cur->_parent;
        }
        else//uncle不存在或为黑
        {
            if (cur == parent->_right)	//cur在parent右侧,需要左单旋
            {
                RotateL(grandfather);
                parent->_col = BLACK;
                grandfather->_col = RED;
            }
            else //cur在parent左侧,需要右左双旋
            {
                RotateR(parent);
                RotateL(grandfather);
                cur->_col = BLACK;
                grandfather->_col = RED;
            }
            break;
        }
    }
}
//不管三七二十一,根节点一定为黑
_root->_col = BLACK;
return true;
 
插入的完整代码
bool Insert(const pair<K, V>& kv)
{
    if (_root == nullptr)
    {
        _root = new Node(kv);
        _root->_col = BLACK;//根节点为黑
        return true;
    }
    Node* cur = _root;
    Node* parent = _root;
    //确定插入位置
    while (cur)
    {
        if (cur->_kv.first > kv.first)
        {
            parent = cur;
            cur = cur->_left;
        }
        else if (cur->_kv.first < kv.first)
        {
            parent = cur;
            cur = cur->_right;
        }
        else
        {
            return false;
        }
    }
    //插入节点
    cur = new Node(kv);
    cur->_parent = parent;
    if (parent->_kv.first < kv.first)
    {
        parent->_right = cur;
    }
    else
    {
        parent->_left = cur;
    }
    //判断是否破坏红黑树的性质
    while (parent && parent->_col == RED)
    {
        Node* grandfather = parent->_parent;
        if (parent == grandfather->_left)	//parent在grandfather的左边
        {
            Node* uncle = grandfather->_right;
            if (uncle && uncle->_col == RED)		//uncle存在且为红
            {
                //直接变色
                parent->_col = uncle->_col = BLACK;
                grandfather->_col = RED;
                //再向上判断调整
                cur = grandfather;
                parent = cur->_parent;
            }
            else		//uncle不存在或为黑
            {
                if (cur == parent->_left)	//cur在parent左侧,需要右单旋
                {
                    RotateR(grandfather);
                    parent->_col = BLACK;
                    grandfather->_col = RED;
                }
                else  //cur在parent右侧,需要左右双旋
                {
                    RotateL(parent);
                    RotateR(grandfather);
                    cur->_col = BLACK;
                    grandfather->_col = RED;
                }
                break;
            }
        }
        else		//parent在grandfather的右边
        {
            Node* uncle = grandfather->_left;
            if (uncle && uncle->_col == RED)		//uncle存在且为红
            {
                //直接变色
                parent->_col = uncle->_col = BLACK;
                grandfather->_col = RED;
                //再向上判断调整
                cur = grandfather;
                parent = cur->_parent;
            }
            else		//uncle不存在或为黑
            {
                if (cur == parent->_right)	//cur在parent右侧,需要左单旋
                {
                    RotateL(grandfather);
                    parent->_col = BLACK;
                    grandfather->_col = RED;
                }
                else  //cur在parent左侧,需要右左双旋
                {
                    RotateR(parent);
                    RotateL(grandfather);
                    cur->_col = BLACK;
                    grandfather->_col = RED;
                }
                break;
            }
        }
    }
    //根节点一定为黑
    _root->_col = BLACK;
    return true;
}
//左单旋
void RotateL(Node* parent)
{
    Node* cur = parent->_right;
    Node* curleft = cur->_left;
    parent->_right = curleft;
    if (curleft)
    {
        curleft->_parent = parent;
    }
    cur->_left = parent;
    Node* ppnode = parent->_parent;//记录parent的原父亲节点
    parent->_parent = cur;
    //对cur的父亲进行更新
    if (parent == _root)
    {
        _root = cur;
        cur->_parent = nullptr;
    }
    else//说明左旋的部分只是某棵树的局部
    {
        if (ppnode->_left == parent)
        {
            ppnode->_left = cur;
        }
        else
        {
            ppnode->_right = cur;
        }
        cur->_parent = ppnode;
    }
}
//右单旋
void RotateR(Node* parent)
{
    Node* cur = parent->_left;
    Node* curright = cur->_right;
    //让右节点接到parent的左边,再将parent接到cur的右边
    parent->_left = curright;
    if (curright)
    {
        curright->_parent = parent;
    }
    cur->_right = parent;
    Node* ppnode = parent->_parent;//记录parent的原父亲节点
    parent->_parent = cur;
    //对cur的父亲进行更新
    if (parent == _root)
    {
        _root = cur;
        cur->_parent = nullptr;
    }
    else//说明右旋的部分只是某棵树的局部
    {
        if (ppnode->_left == parent)
        {
            ppnode->_left = cur;
        }
        else
        {
            ppnode->_right = cur;
        }
        cur->_parent = ppnode;
    }
}
 
红黑树的验证
红黑树的检测分为两步:
- 检测其是否满足二叉搜索树(即看中序遍历)
 - 检测其是否满足红黑树的性质
 
这里主要说一下第二步:
//检查节点颜色
bool CheckColour(Node* root, int blacknum, int benchmark)//这里的blacknum不能是引用,为的就是当回退到根节点时blacknum的值为1,这样能使各路径的黑节点个数之间不会相互影响
{
    //当root为空,说明该路径走到头了,此时将统计的黑节点个数与基准值进行比较
    if (root == nullptr)
    {
        if (blacknum != benchmark)
            return false;
        return true;
    }
    if (root->_col == BLACK)
        ++blacknum;
    //若root为红,且root的父亲存在也为红
    if (root->_col == RED && root->_parent && root->_parent->_col == RED)
    {
        cout << root->_kv.first << "出现连续红色节点" << endl;
        return false;
    }
    return CheckColour(root->_left, blacknum, benchmark)
        && CheckColour(root->_right, blacknum, benchmark);
}
bool IsBalance()
{
    return IsBalance(_root);
}
//判断红黑树是否平衡
bool IsBalance(Node* root)
{
    if (root == nullptr)
        return true;
    //根节点一定为黑
    if (root->_col != BLACK)
        return false;
    //为了判断各路径的黑节点个数是否相同,先给出一个基准值(以最左或最右路径为基准值)
    int benchmark = 0;//基准值
    Node* cur = root;
    while (cur)
    {
        if (cur->_col == BLACK)
            ++benchmark;
        cur = cur->_left;
    }
    return CheckColour(root, 0, benchmark);
}
 
AVL树和红黑树的比较
AVL树优势在于树的高度低,而红黑树的优势在于旋转次数少

单看搜索,AVL树的效率大概是红黑树的两倍
但其实对于CPU而言,搜索30次和搜索60次,几乎没有区别
所以我们认为两者的性能是同一量级的
但是AVL树控制严格平衡是付出代价的,插入和删除时需要进行大量旋转。而红黑树减少了旋转的次数
我们通过如下代码对AVL树和红黑树的高度和旋转次数进行对比:
分别在AVLTree.h和RBTree.h中添加如下代码:
public:
//计算高度
//获取树的高度
int TreeHeight()
{
    return TreeHeight(_root);
}
int TreeHeight(Node* root)
{
    if (root == nullptr)
        return 0;
    int leftHeight = TreeHeight(root->_left);
    int rightHeight = TreeHeight(root->_right);
    return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
}
//增加一个公有成员:旋转次数
public:
	int _rotateCount = 0;//旋转次数
//分别在红黑树和AVL树的左单旋与右单旋的开头增加一行代码:			  ++_rotateCount
 
main.cpp中调用代码如下:
#include"RBTree.h"
#include"AVLTree.h"
#include<vector>
int main()
{
	const int N = 1000000;
	vector<int> v;
	v.reserve(N);
	srand(time(0));
	for (size_t i = 0; i < N; i++)
	{
		v.push_back(rand());
	}
	RBTree<int, int> rbt;
	for (auto e : v)
	{
		rbt.Insert(make_pair(e, e));
	}
	cout <<"红黑树是否平衡:"<<rbt.IsBalance() << endl;
	cout <<"红黑树高度:"<< rbt.TreeHeight() << endl;
	cout <<"红黑树旋转次数:"<< rbt._rotateCount << endl;
	AVLTree<int, int> avlt;
	for (auto e : v)
	{
		avlt.Insert(make_pair(e, e));
	}
	cout <<"AVL树是否平衡:"<<avlt.IsBalance() << endl;
	cout <<"AVL树高度:"<<avlt.Height() << endl;
	cout <<"AVL树旋转次数:"<<avlt._rotateCount << endl;
	return 0;
}
 
两次运行结果:

总结:两个树都是高效的平衡二叉树,增删查改的时间复杂度都是logN。不过红黑树降低了旋转次数,因此相对AVL树更优一点,所以被使用的也更多



















