随机森林算法

[1]

随机森林是集成学习中的bagging方法.通过有放回的抽样方法训练模型.再通过对输出求均值的方式得出最终结果。其中,回归树将输入样本分配至其子节点,不同子节点对应不同的取值.再通过损失函数将样本进行训练和分配,直至达到叶子结点。回归树通过空间超平面的划分方法在每次分割时对当前空间的取值进行划分。

[2]

随机森林是Bagging回归的进化版机器学习算法,以决策树为基本单元,每个决策树都是通过对输入数据集进行bootstrap得到的,通过集成学习的思想将多棵决策树组合[18]。首先.随机地从全部P个变量中选取n (1SnSP) 个变量作为决策树节点[31].然后构建数百甚至上千个决策树.每个决策树会根据特定规则对数据进行分类或回归,最后通过投票、取平 均等方法将所有决策树预测结果汇总,得到最终输出结果[ 16]。随机森林不仅可以提供自变量对因变量的偏依赖图(partial dependence) 。还能量化各个自变量对因变量估计差异的影响和相对贡献率[ 19]。相比传统线性或非线性回归模型,随机森林无需预先设定函数形式,能克服变量之间的复杂交互作用,避免过度拟合并且具有较高的模型精度。构建随机森林模型时需要考虑2个重要参数,即决策树的数量(ntree) 和节点竞争变量数目(mtry) [321。 通常情况下ntree只需保证随机森林的整体误差趋于稳定即可[331,本研究中ntree=1500。mtry在默认情况 下取值为自变量数量的1/3 (取整), 然而默认值不一定适用于所有 数据[ 18],所以对mtry进行调优。本研究将mtry取值范围设为1smtryS13。采用十折交叉验证法(ten-fold cross validation)进行超参数优化.确定最优的mtry值。随机森林模型可以提供预测变量的相对重要性及偏依赖图,从而提高模型的可解释性。相对重要性表示每个自变量对因变量的贡献程度。而偏依赖图则反映了自变量对因变量的非线性关系。

[3]

随机森林是由Breiman等人[19开发的一-种集成统计学习技术,作为CART算法(分类和回归树算法) [20]的改进。与传统的决策树算法和神经网络算法相比,RF回归具有计算资源相对较少、预测精度更高的优势。RF模型被认为在处理分类和回归问题时具有较高的鲁棒性和抗过拟合性,因为它可以调用数千棵CART树[21]。随机森林回归算法被视为一组回归树的集合。图2显示了RF模型预测的构建框架。如图2所示,一个回归树表示一组规则, 这些规则可以从根节点连续应用于输入数据的叶节点。随机选择一组输入变量 ,并从原始数据集中替换以形成回归树。每棵树都根据选择分割变量j和平方误差最小的分割点s的标准进行分割:

 其中y表示数据集的输出变量。R和R 2是根据分裂变量j和分裂点s定义的两个区域:

重复以上分割过程,直到树停止生长。得到回归树模型的解是:

其中I(x∈Ri) i是索引函数:

通过组合这些树并对每棵树的预测求平均值,可以获得最终预测值。

[4]

机器学习作为应用统计学的延伸,已经被广泛应用于解决各类具体问题之中。随机森林是- -种集
成的机器学习方法,可通过组合多个决策树组合,有效学习捕捉海量数据复杂的非线性规律。随机森,林模型展现了广泛的适用性,成为解决复杂问题的有力工具。在城市规划领域,随机森林可通过对历史大数据分析,揭示影响城市空间变化机制并预测未来空间发展。相比于传统统计回归模型在空间分析中的应用,随机森林不易受到共线性影响,且能够自动评估影响要素的重要性。此外,随机森林通过多棵树集成降低了单树的过拟合风险,受异常值影响.相对较小。因此,本研究将随机森林模型应用于城市创新空间演变,尝试更全面、准确地理解创新空间用地空间分布形成及其影响因素。
 

[1]王延林,魏思浩,苏馨等.基于随机森林的导管架海洋平台结构模型修正方法[J].中国海洋平台,2024,39(01):38-44+58.

[2]王晓楠,苏文浩,董灵波.基于随机森林的兴安落叶松天然林单木年龄预估模型[J/OL].应用生态学报:1-11[2024-03-05].https://doi.org/10.13287/j.1001-9332.202404.023.

[3]郭龙,郭文文.基于SVR和随机森林模型的动力煤高位发热量预测研究[J].能源工程,2024,44(01):35-42.DOI:10.16189/j.nygc.2024.01.005.

[4]陈从心,张萍,韩叙.基于随机森林模型算法的城市创新空间演变影响要素研究——以武汉市主城区为例[J/OL].新建筑:1-4[2024-03-05].http://kns.cnki.net/kcms/detail/42.1155.TU.20240126.2054.002.html.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/431035.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

StarRocks实战——特来电StarRocks应用实践

目录 一、为何引入StarRocks 二、主要应用场景 三、封装或扩展 四、集群监控预警 五、总结规划展望 5.1 使用经验分享 5.2 下一步计划 5.2.1 StarRocks集群自动安装 5.2.2 StarRocks集群高可用架构 原文大佬的这篇StarRocks应用实践有借鉴意义,这里摘抄下来…

1、Ajax、get、post、ajax,随机颜色

一、Ajax初始 1、什么是Ajax? 异步的JavaScript和xml 2、xml是什么? 一种标记语言,传输和存储数据----------现在用JSON传输数据 3、Ajax的作用 局部加载 可以使网页异步更新 4、Ajax的原理或者步骤(6步) 创建Ajax对象 if (window.X…

centos 搭建ftp服务器

项目上需要用到ftp文件服务同步,所以在测试环境进行搭建,其中遇到了一些问题,遂记录。 1、安装vsftpd软件包 打开终端并输入以下命令来安装vsftpd yum install vsftpd -y 2、运行vsftpd systemctl start vsftpd 3、测试匿名连接 我这里…

基于springboot+vue的球队训练信息管理系统

博主主页:猫头鹰源码 博主简介:Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战,欢迎高校老师\讲师\同行交流合作 ​主要内容:毕业设计(Javaweb项目|小程序|Pyt…

【OBS】obs-websocket实战技巧,让你更快的了解OBS

▒ 目录 ▒ 🛫 导读开发环境 1️⃣ 修改OBS-web源码2️⃣ 常用api汇总获取输入源类型列表获取输入源列表获取属性列表打开输入源属性设置框获取设置输入源静音状态获取特殊输入源设置(全局音频设备)打开输入源属性设置框 🛬 文章小…

HubSpot出海CRM可以为企业带来哪些好处?

HubSpot出海CRM为企业带来了许多好处,包括但不限于以下几点: 优化客户体验: HubSpot出海CRM提供了个性化的客户关系管理功能,使企业能够根据客户的地理位置、偏好和行为等因素,提供个性化的营销和服务。这有助于提高客…

数位dp 笔记

小技巧1:求区间[X, Y]可以转换为求F(Y) - F(X-1) F(X)表示0~X中满足条件的数字个数 小技巧2:可以用树的形式来看 遍历最高位,每一位分为两种情况:未达到上界和达到上界 如果走到右边最底端需加1 度的数量 求给定区间 [X,Y]中满足下列条件的…

linux系统UDP丢包问题分析思路

Linux系统UDP丢包 最近工作中遇到某个服务器应用程序 UDP 丢包,在排查过程中查阅了很多资料,总结出来这篇文章,供更多人参考。 在开始之前,我们先用一张图解释 linux 系统接收网络报文的过程。  1,首先网络报文通过物…

软件测试--性能测试工具JMeter

软件测试--性能测试工具JMeter 主流性能测试工具1.主流性能测试工具Loadrunner和Jmeter对比 —— 相同点2.主流性能测试工具Loadrunner和Jmeter对比 —— 不同点JMeter基本使用JMeter环境搭建1.安装JDK:2.安装Jmeter:3.注意点:JMeter功能概要1. JMeter文件目录介绍1.1 bin目…

JavaScript的`call`方法:实现函数间的调用!

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

express+mysql+vue,从零搭建一个商城管理系统10--添加商品

提示:学习express,搭建管理系统 文章目录 前言一、新建models/goods.js二、新建routes/goods.js三、添加goods表四、添加商品总结 前言 需求:主要学习express,所以先写service部分 一、新建models/goods.js models/goods.js con…

亚马逊卖家做市场分析业务可以用静态IP代理完成吗?

亚马逊作为全球最大的电商平台之一,其庞大的销售数据和用户行为数据成为了许多商家和市场研究人员进行市场分析和竞争研究的重要来源。而使用IP代理则能够为亚马逊市场分析带来许多帮助,下面就来一一介绍。静态IP代理可以为市场分析带来哪些帮助&#xf…

高维中介数据: 联合显着性(JS)检验法

摘要 中介分析在流行病学和临床试验中越来越受到关注。在现有的中介分析方法中,流行的联合显着性(JS)检验会产生过于保守的 I 类错误率,因此功效较低。但是,如果在使用 JS 测试高维中介假设时,可以准确控制…

表达式和语句

本文参考C Primer Plus进行C语言学习 文章目录 表达式语句 副作用和序列点复合语句(块)类型转换 1.表达式 表达式由运算符和运算对象组成。下面是一些表达式: 4 -6 421 a*(bc/d)/20 q5*2 xq%3 q>3 每个表达式都有一…

基于带时间窗口的电动汽车路由问题的精英对立学习的多群PSO(2022)

英文:Multi-swarm PSO based on Elite Opposite Learning on Electric Vehicle Routing Problem with Time Window 摘要: 带时间窗口的电动汽车路由问题(EVRPTW)是交通领域的一个新问题,用传统的精确求解方法很难解决…

vue3.0源码解析之数据代理Proxy

前言 多年前刚转前端的时候,对频繁的拼接页面元素深恶痛绝,当时是通过封装字符串模版来处理页面的。之后又陆续发现,数据变化后需要频繁的修改dom节点来操作页面,便不得不自己写很多更新的代码,直到出现了vue和react、…

【排序】详解堆排序

一、思想 堆排序是一种基于比较的排序算法,且使用了堆的数据结构来辅助进行排序。其思想是利用堆的特性,即在每个节点都保证是最大(大顶堆)或者最小(小顶堆)的关键码。具体原理和步骤如下: 构…

基于SpringBoot的论坛系统(附项目源码+论文)

摘要 如今的时代,是有史以来最好的时代,随着计算机的发展到现在的移动终端的发展,国内目前信息技术已经在世界上遥遥领先,让人们感觉到处于信息大爆炸的社会。信息时代的信息处理肯定不能用之前的手工处理这样的解决方法&#xf…

最值得入手的五款骨传导耳机,六大专业的选购技巧

亲爱的小伙伴们,你们是否曾因长时间戴着耳机而感到耳朵不适,比如耳朵闷痛、发痒,甚至出现异味?现在有一种耳机可以帮你解决这些问题,它就是骨传导耳机。这种耳机的设计避免了传统入耳式耳机可能带来的堵塞感和细菌滋生…

【prompt五】CoCoOP:Conditional Prompt Learning for Vision-Language Models

motivation 随着像CLIP这样强大的预训练视觉语言模型的兴起,研究如何使这些模型适应下游数据集变得至关重要。最近提出的一种名为上下文优化(CoOp)的方法将提示学习(nlp的最新趋势)的概念引入视觉领域,以适应预训练的视觉语言模型。具体来说,CoOp将提示中的上下文单词转换为…