网问答>>小白能看得懂的数模算法系列:集成学习(一)集成学习概述
问题
已解决

小白能看得懂的数模算法系列:集成学习(一)集成学习概述

时间:2024-08-19 03:21:17
小白能看得懂的数模算法系列:集成学习(一)集成学习概述
最佳回答
欢迎来到建模的世界,让我们一起探索集成学习的奇妙之旅!(^^●)在深入理解集成学习之前,先理解两个基本概念:过拟合与欠拟合。它们是机器学习建模过程中的常见挑战。过拟合就像过于亲密地模仿,模型在训练数据上表现良好,但在新数据上却可能失效;而欠拟合则是模型过于简单,无法充分捕捉数据的复杂性。拟合就像用线去贴近点集,理想情况下,曲线应尽可能接近所有点。然而,有时候,过度拟合的模型就像图二中的第三个图像,只适合特定训练数据,对新数据失效。我们可以通过一个例子来理解:假设我们要建立一个帅哥识别模型,如果只用吴彦祖的照片训练,得到的结果可能就过于特定,这就是过拟合。而欠拟合则是模型过于简单,无法有效识别所有类型的帅哥,比如吴彦祖的亲戚可能无法准确识别他。现在,我们正式进入集成学习的话题。集成学习是一种策略,将多个基础模型结合,通过bagging(并行学习)减少方差,如随机森林;或者通过boosting(迭代学习)提升模型性能,如AdaBoost和GBDT(梯度提升决策树)。例猛搏颤如,随机森林是决策树的bagging应用,而AdaBoost则是弱分银枣类器的boosting组合,而GBDT则是结合了梯度提升枝败和决策树。记住,集成学习就像团队合作,通过多样性提升整体实力。如果你对建模还有更多疑问,欢迎关注@学力学的力哥,我们将一起探索更多建模技巧,一起向国赛冲刺!预祝大家在学习路上取得佳绩!( ̄︶ ̄)↗
时间:2024-08-19 03:21:17
本类最有帮助
Copyright © 2008-2013 www.wangwenda.com All rights reserved.冀ICP备12000710号-1
投诉邮箱: