【AI读论文】AutoML的8年回顾:分类、综述与趋势

论文标题:Eight years of AutoML: categorisation, review and trends

论文链接:https://link.springer.com/article/10.1007/s10115-023-01935-1

本文主要围绕自动机器学习(AutoML)展开了系统性的文献综述,总结了该领域的主要观点和发现。以下是对每个章节的主要观点的归纳总结:

  1. 摘要

  • AutoML的目的:解决机器学习方法在实际应用中所需的技术知识和背景,以及耗时和重复的步骤,使其更加实用。

  • AutoML的发展历程:自2014年出现以来,AutoML领域的发表数量显著增长。

  • 主要技术趋势:神经架构搜索(NAS)的增长明显,算法选择问题逐渐被工作流程组合所取代。

2. 理论背景

  • AutoML的目的:自动化机器学习过程中的各个阶段和任务,以及应用的技术。

  • AutoML的主要任务:超参数优化、神经架构搜索、算法选择和工作流程组合。

3. 综述方法

  • 研究问题:对AutoML领域的研究进行了四个主要问题的调查,包括术语的提取、定量发展趋势、自动化阶段和技术的覆盖范围,以及未来的趋势和开放性问题。

4. AutoML分类法

AutoML分类方法是根据文献综述中提出的三维分类法,对AutoML方法进行分类的一种方法。这个分类方法包括三个维度:自动化的知识发现过程阶段、执行的任务以及应用的技术。让我们对这三个维度进行更详细的介绍:

  • 自动化的知识发现过程阶段:这个维度涉及到AutoML方法所涉及的知识发现过程的不同阶段,例如数据预处理、数据挖掘和后处理等。文献综述发现,AutoML主要集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。这个维度的分类可以帮助研究人员了解不同AutoML方法在知识发现过程的不同阶段上的应用情况。

  • 执行的任务:这个维度涉及到AutoML方法所执行的具体任务,例如超参数优化、神经架构搜索、算法选择和工作流程组合等。文献综述发现,AutoML方法主要集中在超参数优化和神经架构搜索等任务上。这个维度的分类可以帮助研究人员了解不同AutoML方法在执行不同任务时所采用的方法和技术。

  • 应用的技术:这个维度涉及到AutoML方法所应用的具体技术和方法,例如进化算法、贝叶斯优化、梯度下降等。文献综述发现,不同的AutoML方法采用了不同的技术和方法来解决自动化问题。这个维度的分类可以帮助研究人员了解不同AutoML方法所采用的技术和方法的差异和特点。

这个三维分类法为AutoML方法的分类提供了一个全面的框架,帮助研究人员更好地理解和比较不同的AutoML方法。

5. 定量结果

  • 发现AutoML领域的研究数量自2014年以来呈现显著增长,2021年的发表数量几乎是2014年的五倍。

  • 发现AutoML主要集中在数据挖掘阶段,而其他阶段的自动化研究相对较少。

73f6ded6d9c85cd2b9a1b53e9f6d397a.png

AutoML历年相关论文数量

6. 质性结果

  • 发现AutoML领域的主要研究集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。

  • 发现AutoML方法倾向于将自动化过程视为黑匣子问题,限制了生成模型的可解释性或关于达到生成解决方案的过程的解释。

7. 阶段、任务和技术的交叉分析

对AutoML方法在不同维度之间的关系进行了分析。这个分析旨在揭示不同阶段、任务和技术之间的关联,以便更好地理解当前的AutoML研究趋势和存在的挑战。

  • 阶段和任务的关系:通过分析不同任务在自动化知识发现过程的不同阶段中的应用情况,研究人员发现了一些趋势和模式。例如,他们可能发现某些任务在特定阶段中的应用频率较高,而在其他阶段中较低。这有助于了解不同任务在知识发现过程中的角色和重要性。

  • 任务和技术的关系:通过分析不同任务所应用的技术和方法,研究人员可以揭示不同任务所采用的技术趋势。例如,他们可能发现某些任务更倾向于采用特定的技术或方法,而其他任务则更倾向于采用不同的技术。这有助于了解不同任务所涉及的技术和方法的差异和特点。

这种交叉分析有助于揭示AutoML研究中不同维度之间的关系,为研究人员提供了更深入的理解和见解。这种分析有助于发现当前的研究趋势、存在的挑战以及未来的研究方向。

8. 开放性问题、挑战和趋势

在挑战部分,研究人员指出了AutoML领域面临的一些挑战和问题,并对未来的发展趋势进行了推测和讨论。

  • 未覆盖的阶段:研究发现,AutoML主要集中在数据挖掘阶段,而对于预处理和后处理阶段的自动化研究相对较少。这意味着AutoML方法尚未涵盖整个知识发现过程,而是集中在部分阶段的自动化上。这表明未来的研究需要更多地关注知识发现过程中其他阶段的自动化,以实现更全面的自动化支持。

  • 缺乏互操作性:目前的AutoML方法通常只自动化知识发现过程的单个阶段,而缺乏不同方法之间的互操作性。这意味着不同的AutoML方法往往是孤立的,难以相互配合和复用。未来的研究需要考虑如何实现不同AutoML方法之间的互操作性,以便更好地支持整个知识发现过程的自动化。

  • 人类角色的作用:AutoML方法通常作为黑匣子方法,缺乏对生成模型的解释和人类参与的支持。未来的研究需要考虑如何将人类纳入AutoML系统的自动化过程中,以实现更好的交互和指导。此外,未来的研究还需要关注如何生成可解释的模型,以便更好地支持人类的理解和解释。

  • 实证验证和可复制性:研究发现,许多AutoML方法在实验验证方面存在一些不足。例如,一些方法只是与简单的机器学习基准进行比较,而缺乏与其他研究的比较。此外,一些方法也缺乏适当的统计框架支持。未来的研究需要更加重视实证验证和可复制性,以确保AutoML方法的有效性和可靠性。

这些挑战和问题为AutoML领域的未来发展提出了一些重要的方向和目标。未来的研究需要关注如何解决这些挑战,以实现更全面、有效和可靠的AutoML方法。

  1. 结论

  • AutoML仍然是一个新兴的领域,面临着许多有前途的挑战,尤其是在神经架构搜索方面的显著发展趋势。

  • 提出了一个AutoML分类法,将有助于未来研究的分类,并为对AutoML感兴趣的研究人员和从业者提供参考。

这些总结突出了AutoML领域的主要发现和趋势,为该领域的研究和实践提供了有价值的见解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/179939.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

CVE-2022-21661

简介 CVE-2022-21661是一个与WordPress相关的漏洞,涉及到SQL注入问题。该漏洞主要源于WordPress的WQ_Tax_Query类中的clean_query函数,可能允许攻击者通过控制传递给该函数的数据来控制生成的SQL查询,从而执行任意的SQL代码。 当WordPress的…

openEuler 22.03 LTS x86_64 cephadm 部署ceph18.2.0 未完成 笔记

环境 准备三台虚拟机 10.47.76.94 node-1 10.47.76.95 node-2 10.47.76.96 node-3 下载cephadm [rootnode-1 ~]# yum install cephadm Last metadata expiration check: 0:11:31 ago on Tue 21 Nov 2023 10:00:20 AM CST. Dependencies resolved. Package …

学生护眼台灯哪个牌子最好?考研必备五款护眼台灯推荐

2023年6月6日,第28个全国“爱眼日”。国家卫健委发布数据显示,2022年全国儿童青少年总体近视率为53.6%,超过一半;其中6岁儿童为14.5%,小学生为36%,初中生为71.6%,高中生为81%。 学生护眼台灯哪个…

测绘资质技术管理制度

技术管理制度 建立健全技术管理制度,明确技术设计、技术处理和技术总结等要求。其中简单、日常性的测绘项目可以制定《作业指导书》 质量检查管理制度 建立健全质量检查管理制度,明确过程检查、最终检查、质量评定、检查记录和检查报告等要求。 人员培训…

玻璃加工ERP包含些模块?玻璃加工ERP好用吗

玻璃制品的类型多、规格不一、营销策略灵活、销售渠道广泛、生产关联业务环节。在当今这个市场竞争日益激烈的时代,如何有效整合各个业务环节,提升多部门协作效率,随时进行数据分析等,是每个玻璃加工企业面临的管理难题。 在数字…

4.18每日一题(极坐标累次积分到直角坐标累次积分的转换)

注:rdr化为直角坐标以后r直接消去了,不需要计算

购买Zoho CRM系统要花多少钱?

相信对CRM系统有过了解的人都知道,CRM系统的价格取决于功能需求,用户数量,部署方式,定制开发等因素。Zoho CRM是全球领先的云CRM系统,自2005年推出以来,累计服务25万企业,那么Zoho CRM系统的价格…

【ROS 2 进阶-MoveIt!】MoveIt!中的关键节点

所有内容请查看:博客学习目录_Howe_xixi的博客-CSDN博客 原文档链接:Docs

Python基于机器学习模型LightGBM进行水电站流量入库预测项目源码+数据集+模型,含项目报告

1.前言 该文档主要是介绍通过机器学习模型LightGBM进行水电站流量入库预测。 对于水电站来说,发电是主要经济效益来源,而水就是生产的原料。对进入水电站水库的入库流量进行精准预测,能够帮助水电站对防洪、发电计划调度工作进行合理安排&…

完整的工程项目管理流程是怎么样的?

阅读本文你将了解工程项目管理的完整流程:一、项目启动阶段;二、项目规划阶段;三、项目执行阶段;四、项目收尾阶段;五、项目总结与反馈。 这是一个工程项目管理的完整流程: 项目启动阶段:也就…

Failed to load steamui.dll问题与解决方法详解,3分钟教你修复steamui.dll文件

我们运行Steam客户端时,有时可能会遇到一个错误提示,称为“Failed to load steamui.dll”。这种情况对于任何想要使用Steam服务的玩家来说都是一种麻烦。那么,具体是什么意思呢?出现这个问题的原因又是什么呢?又该如何…

社交电商-揭秘芬香推广挣钱模式^_^

社交电商-揭秘芬香推广挣钱模式^_^ 第一步:下载安装芬香APP 第二步:打开微信小程序 小程序需要我单独微信发你 第三步:输入邀请码(SCT9UA) 邀请码:SCT9UA 第四步:分享芬香APP商品链接 直接点…

RFID解码模块与继电器控制LED灯

RFID解码模块与继电器控制LED灯 简介电气参数功能特征串口通信协议使用步骤总结 简介 REID(Radioa Frequency ldentification)即射频识别技术,是一种通过无线电信号识别目标物的技术。RFID模块是应用于RFID技术的一种设备,它能够实现对物体的识别和跟踪…

中国跨境电商暴露数百万用户隐私数据,部分含身份证照片

近日,据外媒TechCrunch报道称,云安全公司CloudDefense.ai的安全研究员发现,由于一家中国电商店铺的数据库暴露在互联网上,数百万中国公民的隐私数据遭到泄露,这些数据包括了客户送货地址、电话号码、身份证号码及身份证…

IT 论坛测试报告

一、引言 1、项目简介 本项目是一个B/S架构的论坛系统,依托线上平台为用户提供一个便于交流、讨论的场所。该系统使用前后端的设计模式,围绕用户和和帖子两个核心对象进行业务处理,实现了用户注册登录、帖子管理,用户个人中心&a…

可编程交流回馈式负载箱在电源设备中的应用

可编程交流回馈式负载箱可以用于测试电源设备的输出能力,通过在负载箱中设置不同的负载条件,可以模拟不同的工作负载情况,从而测试电源设备在不同负载下的输出能力和稳定性。这对于电源设备的设计和生产非常重要,可以帮助制造商评…

设置定时自动请求测试_自动定时循环发送http_post请求---postman工作笔记001

其实就是创建接口文件夹的时候,有个monitor collection 用来监听接口执行情况,这里就可以设置 可以看到多久执行一次对吧,这里可以设置每几分钟执行一次,一共执行多少次等等 但是这里要说明一下,如果需要使用monitor功能,必须需要登录, 所以如果这里点击monitor collection…

微信开放平台Android平台应用签名怎么填写

winR 输入cmd 进到本地签名文件的目录下 输入 keytool -list -v -keystore <keystore文件路径> -alias <别名>请将 <keystore文件路径> 替换为您的密钥库文件&#xff08;通常是 .jks 或 .keystore 文件&#xff09;的路径&#xff0c;而 <别名> 则是…

【C语法学习】27 - 字符串转换为数字

文章目录 1 atoi()函数1.1 函数原型1.2 参数1.3 返回值1.4 转换机制1.5 示例1.5.1 示例1 1 atoi()函数 1.1 函数原型 atoi()&#xff1a;将str指向的字符串转换为整数&#xff0c;函数原型如下&#xff1a; int atoi(const char *str);1.2 参数 atoi()函数只有一个参数str&…