- 三、决策树
- 1.决策树模型的原理
- 1)什么是决策树
- 2)决策树模型原理
- 3.构建决策树的目的
- 4)决策树的优缺点
- 2.决策树的典型生成算法
- 1)常用的特征选择有信息增益、信息增益率、基尼系数
- 2)基于信息增益的ID3算法
- 3)基于信息增益率的C4.5算法
- 4)基于Gini系数的CART算法
- 5)CART树连续变量与离散变量的处理
- 6)不同决策树算法的比较
- 3.算例
- 四、随机森林
- 1.集成学习
- 2.随机森林原理
- 1)定义
- 2)建模步骤
- 3)优缺点
- 补充:HEU的决策树
- 随机变量的熵 H(Y)
- 条件熵 H(Y|A)
- 信息增熵 G(A) = H(Y) - H(Y|A)
- 回归树
- 补充:HEU的随机森林
三、决策树

1.决策树模型的原理
1)什么是决策树


2)决策树模型原理

3.构建决策树的目的

4)决策树的优缺点

2.决策树的典型生成算法
1)常用的特征选择有信息增益、信息增益率、基尼系数

2)基于信息增益的ID3算法


3)基于信息增益率的C4.5算法


4)基于Gini系数的CART算法


5)CART树连续变量与离散变量的处理




6)不同决策树算法的比较

3.算例















四、随机森林

1.集成学习




2.随机森林原理
1)定义

2)建模步骤

3)优缺点



补充:HEU的决策树

随机变量的熵 H(Y)



条件熵 H(Y|A)
信息增熵 G(A) = H(Y) - H(Y|A)
















回归树







补充:HEU的随机森林








![[JVM]再聊 CMS 收集器](https://img-blog.csdnimg.cn/a4fe8c81a83745e8bf7d9c1cf60639d9.png)
















