您现在的位置是:首页 > 文章详情

Python机器学习(sklearn)——分类模型评估与调参总结(下)

日期:2018-07-22点击:563

21.集成方法有随机森林(random forest)和梯度提升树(gradient boosted decision tree)GBDT

随机森林中树的随机化方法有两种:

(1)通过选择用于构造树的数据点
构造随机森林需要确定用于构造的树的个数
为了确保树与树之间的区别,对每棵树的数据进行自助采样
从样本数据中有放回的多次抽取(一个样本可能被抽取多次),抽取创建的新数据集要和原数据集大小相等(数据数量相同)

(2)通过选择每次划分测试集的特征
在每个节点处,算法随机选择特征的一个子集,并对其中一个特征寻找最佳测试,而不是对每个节点都寻找最佳测试。
使用参数max_features, 如果max_features= n_features,则每次考虑所有特征,即第二种随机性没用上
当max_features较大,随机森林中每棵树都会很相似(因为采用的

原文链接:https://yq.aliyun.com/articles/617561
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章