大数据文摘授权转载自数据派THU编译:wwl、王琦生活中我们做的许多决定都是基于其他人的意见。这包括,通过书评来决定阅读哪一本书;根据多位医生的建议决定选择哪个治疗方案;以及定罪。一般地,一群人共同决策的结果比团队中每个个体单独做决策带来的结果更优。这通常被视为是群体的智慧。对于回归和分类的预测建模问题,通过把多个机器学习的预测模型组合起来,也可以达到类似的结果。这通常叫做集成机器学习,简称集成学习。通过本文,你可以掌握有关集成学习的入门介绍。你将了解到:我们做的许多决定都包含了其他人的意见或投票。群体决策效果比个人更好,这被称为群体的智慧。集成机器学习把多个成熟的模型预测结果组合起来。我们开始吧!
总览
本教程包含三部分:1、做重要决策2、群体的智慧3、集成机器学习
做重要决策
想一想生活中,你做的重要的决策。比如说:买什么书和接下来阅读什么书?参加哪所大学?候选的书都听起来很有趣,但我们实际购买的可能是有最多好评的那一本。候选的大学都可以提供我们感兴趣的课程,但最终的选择会基于有一手消息的朋友和熟人的反馈。我们可能会相信有关这些书籍的评论和星级评级,因为每个人都提供了一个评论,用户跟这个书没有关系(希望如此),且独立于其他人留下的评论。如果不是这样的话,对结果的信任就会受到质疑,对系统的信任也会动摇,这就是为什么亚马逊努力删除图书的虚假评论。另外,想一下更私人的一些重要决定。比如说有关疾病的治疗。我们听取一个专家的建议,但我们还会寻觅第二个、第三个,甚至更多意见,以确保可以得到最好的治疗方案。来自第二个、第三个专家的意见可能和第一个的意见相同也可能相悖,但因为他们的意见都是冷静、客观、独立的,因此会给予重视。但如果专家之间串通了意见,那么寻找第二个、第三个专家意见的过程就没有意义了。“当面临重要决策时,我们通常会寻求不同专家的意见来帮助我们做出决策。”—Page2,EnsembleMachineLearning,.