gbdt子采样参数的理解-白红宇

gbdt子采样参数的理解

阅读量：321 次

发布时间：2019-03-03

本文共 265 字，大约阅读时间需要 1 分钟。

随机森林的子采样是有放回的抽样

gbdt的子采样是无放回的抽样

本人的错误理解：

比如说原来的数据集是100个样本；gbdt的第一棵树是80个样本，第二棵树是剩下的20%，16个样本；依此类推；

错误理解的根本是将抽取0.8样本集的作为一个整体，是否放回；所以才会觉得gbdt难以理解，每棵树都只剩下20%

而正确的理解：是否放回主要针对的是每次抽取的一个样本；所以每棵树抽样的整体都是100个样本；随机森林抽样是放回的，最极端的可能全部都是重复，即一个样本；无放回抽样主要是样本不会重复；gbdt的每棵树都会用80个样本来训练；

转载地址：http://gsgm.baihongyu.com/

你可能感兴趣的文章