Younger 数据集:人工智能生成神经网络

       设计和优化神经网络架构通常需要广泛的专业知识,从手工设计开始,然后进行手动或自动化的精细化改进。这种依赖性成为快速创新的重要障碍。认识到从头开始自动生成神经网络架构的复杂性,本文引入了Younger,这是一个开创性的数据集,旨在推进人工智能生成神经网络架构 (AIGNNA) 的发展

1 现状

  • 早期手动设计: 早期神经网络架构如 AlexNet, ResNet, LSTM, Transformer 等都是手动设计的,需要大量专家知识和经验。这种方法的创新和灵活性有限,难以适应快速发展的数据和应用场景。
  • 神经架构搜索 (NAS): NAS 通过自动化搜索和优化神经网络架构,提高了设计效率。然而,现有的 NAS 方法仍然依赖于预先定义的宏架构和有限的算子类型,限制了创新空间。
  • 现有基准数据集: 现有的 GNN 基准数据集如 Cora, CiteSeer, PubMed, QM9, ZINC 等,主要包含结构简单、静态的图数据,难以测试 GNN 算法的可扩展性、鲁棒性和泛化能力。

2 数据集介绍

数据集来源: Younger数据集来源于超过174K个真实世界模型,这些模型涵盖了来自不同公共模型中心的30多个任务。包括7,629个独特的架构,每个架构都以有向无环图(DAG)的形式表示,并包含了详细的操作员级别的信息。

Younger 数据集分为三个系列:

  • 完整系列: 包含所有从模型中提取的 DAG,记录了原始模型的来源和 ID。
  • 过滤系列: 去除了同构 DAG 后的异构架构集合。
  • 分割系列: 根据特定实验需求,对过滤系列数据进行分割和处理的版本。

3 数据集构建

Younger 数据集的构建过程主要包括以下四个步骤:

3.1 获取神经网络模型

  • 从四个公开的神经网络模型仓库中获取模型:Kaggle Models, PyTorch Hub, ONNX Model Zoo, Hugging Face Hub。这些仓库包含各种深度学习任务和框架的模型,保证了数据的多样性。
  • 开发自动化工具,定期更新数据,确保 Younger 数据集的时效性。

3.2 将模型转换为 ONNX 格式

  • 使用 ONNX 作为统一表示格式,方便不同深度学习框架之间的模型交换和部署。
  • 使用开源工具如 Optimum 和 tf2onnx 进行模型转换,降低转换成本。

3.3 从 ONNX 模型中提取 DAG

  • 开发工具,将 ONNX 模型转换为 DAG,并去除参数信息,确保数据安全和隐私。
  • 在 DAG 中,节点代表 ONNX 算子,记录详细的配置和超参数;边代表算子之间的数据流。

3.4 过滤数据集

  • 使用 Weisfeiler-Lehman (WL) 图哈希算法,识别并过滤掉同构的神经网络架构,保证数据集中每个架构的唯一性。
  • 最终,从 174K 个真实世界模型中提取出 7,629 个异构的神经网络架构。

4 实验验证

证Younger数据集在人工智能生成神经网络架构(AIGNNA)方面的潜力和有效性,并探索其在现实世界场景中的可行性。

4.1 实验设计

  • 统计分析: 在不同的粒度级别(操作员级别、组件级别和架构级别)进行了统计分析,以展示数据集包含足够丰富的先验知识。
  • 实际应用探索: 探索了局部和全局设计范式的实践应用,证明了数据集在现实场景中的可行性。

4.2 统计分析

从低维度和高维度两个层面分析了 Younger 数据集的统计特性,揭示了数据集的丰富性和挑战性。

4.2.1 低维度统计信息

4.2.1.1 图的节点数和边数分布

  • Younger 数据集中包含的 DAG 结构规模差异很大,从仅包含十几个节点的图到包含数十万个节点的图都有。
  • 与现有的图数据集相比,Younger 数据集具有更广泛的节点数分布,这为 GNN 研究提供了更大的挑战和机遇。

4.2.1.2 常用 ONNX 算子

  • Younger 数据集中包含 184 种 ONNX 算子,涵盖了各种类型的算子,包括张量变形、算术运算、逻辑运算和量化等。
  • 其中,最常用的算子包括 ReLU、Conv、Add、MatMul 等,这些算子是构建神经网络架构的基础。

4.2.2 高维度统计信息

4.2.2.1 嵌入学习

使用 GCN 网络对 DAG 进行嵌入,将 DAG 转换为高维向量表示,以便于分析架构的分布特性。

4.2.2.2 不同粒度分析

  • 算子嵌入: 将每个 DAG 中的所有算子进行嵌入,分析算子的分布特性。
  • 子图嵌入: 将每个 DAG 中的所有子图进行嵌入,分析子图的分布特性。
  • 图嵌入: 将每个 DAG 的所有子图嵌入取平均,得到整个 DAG 的嵌入表示。

4.2.2.3 结果分析

  • 算子嵌入: 训练后的嵌入结果能够将高频算子和低频算子区分开来,但由于数据集中算子类型的多样性,学习过程仍然存在一定的偏差。
  • 子图嵌入: 基线模型能够将不同子图的嵌入表示区分开来,但由于数据集中子图结构的复杂性,子图嵌入的学习效果仍然有待提高。
  • 图嵌入: 不同架构的 DAG 嵌入表示在空间中距离较近,表明数据集涵盖了多种主流架构。同时,相同架构的 DAG 嵌入表示也存在多个点,表明数据集中存在该架构的多种变体。

统计分析结果表明,Younger 数据集具有丰富的统计特性,涵盖了各种类型的神经网络架构和算子。同时,数据集的复杂性和多样性也给 GNN 研究带来了新的挑战。

4.3 实际应用探索

4.3.1 局部设计范式

  • 数据流设计: 使用图卷积网络(GCN)、图注意力网络(GAT)和GraphSAGE等模型在数据流设计范式下验证了神经架构细化的有效性。所有模型在Younger数据集上都取得了良好的性能,这证明了现有的图神经网络更适合预测神经网络架构中的数据流。
  • 操作员设计: 使用五种不同的基线模型进行了十次实验,在操作员设计范式下,尽管所有基线模型都取得了高准确率,但F1分数、精确度和召回率仍然较低。这主要是由于Younger中复杂的图结构,其特征是许多操作员类型的存在。其中,多种类型的操作员出现频率较低,这对实现稳健的多分类性能构成了挑战。

4.3.2 全局设计范式

 从头开始设计神经网络架构是一个开放且复杂的挑战。与神经架构搜索不同,后者将搜索空间限制在预定义的宏观架构内,同时优化微观架构元素以获得特定性能,全局范式寻求从基础开始生成包含详细操作员级元素的全面神经网络架构。

4.4 实验结果

  • 在局部范式下,所有模型在Younger数据集上都表现出良好的性能,其中GCN在所有指标上的表现优于其他模型,除了F1分数。
  • 在全局范式下,采用了使用扩散模型生成图的Digrress图生成模型。由于计算资源的限制和Younger图中节点数量最多可达数十万,我们只选择了节点数量在[1, 300]范围内的架构进行训练。

Younger数据集为AIGNNA提供了一个有前景的基准,通过实验,初步验证了Younger在新领域的神经架构设计方面的潜力和有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/743467.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Unity】RPG2D龙城纷争(五)关卡编辑器之地图编辑

更新日期:2024年6月25日。 项目源码:本章发布 索引 简介关卡编辑器窗口类(LevelEditor)一、定义关卡编辑器窗口类二、两种编辑模式三、地块编辑模式1.关卡模板2.打开编辑窗口3.编辑器基本属性4.地块模板5.重新生成地图6.地图刷子7…

基于优化包络相关的Loran-C(罗兰C)信号天地波识别算法及MATLAB仿真代码和实测信号处理

引言 Loran-C接收信号处理中,完成信号的捕获后需要进行信号的跟踪,Loran-C信号的跟踪按照信号处理流程分为天地波识别、周期识别和正向过零点跟踪三个步骤。Loran-C信号通过天波和地波两种方式到达接收点,导致接收到信号为地波和天波的合成信…

YOLOv5改进(八)--引入Soft-NMS非极大值抑制

文章目录 1、前言2、各类NMS代码实现2.1、general.py 3、各类NMS实现3.1、Soft-NMS3.2、GIoU-NMS3.3、DIoU-NMS3.4、CIoU-NMS3.5、EIoU-NMS 4、目标检测系列文章 1、前言 目前yolov5使用的是NMS进行极大值抑制,本篇文章是要将各类NMS添加到yolov5中,同时…

性能优化-布局优化

性能优化-布局优化 屏幕的UI刷新机制 布局的选择 优化控件的使用 原生View的优化 1、屏幕的UI刷新机制 超过16ms会感觉卡顿, 刷新率(Refresh Rate):指一秒内刷新屏幕的次数,例如60HZ; 帧率(F…

菲律宾媒体PR发稿:谷歌SEO优化.关键词排名.谷歌收录

1. 引言 在菲律宾,媒体行业的发展日新月异,尤其是在线媒体。为了在这个竞争激烈的市场中脱颖而出,各家媒体纷纷寻求谷歌SEO优化、提升关键词排名和增加谷歌收录的方法。本文将围绕菲律宾的几大主要在线媒体,如菲律宾在线日志Jour…

优化系统小工具

一款利用VB6编写的系统优化小工具,系统优化、桌面优化、清理垃圾、查找文件等功能。 下载:https://download.csdn.net/download/ty5858/89432367

WPS复制后转置粘贴

1. WPS复制后转置粘贴 复制-》右键-》顶部第一行-》粘贴行列转置,如下图: 2. Excel office365 本地版 2. Excel office365 在线版

孙子兵法的笔记

系列文章目录 孙子兵法的笔记 三十六计的笔记 文章目录 系列文章目录1、始计第一【原文】【译文】 1、始计第一 用兵始于计谋,善善策出自“庙算”,而精确的“庙算”又来自对各种因素的侦测考察。 孙子在第一章中非常具体地提出了“五事”“七计”的考察标…

缓冲池管理器

开发环境搭建 克隆 git clone https://github.com/cmu-db/bustub.git cd bustub/ 切换分支 git checkout -b branchname v20221128-2022fall 创建docker镜像 docker build . -t bustub_img 创建容器 docker create -it --name bustub_container -v “E:/cmu/bustub”:“/bustu…

自然语言处理课程论文:《Attention is all you need》复现与解读

目录 1.背景介绍 1.1 文献介绍 1.2 研究背景 1.3 知识概述 1.3.1 机器翻译 1.3.2 attention机制与self-attention机制 2.数据来源与处理 2.1 数据集描述 2.2 数据处理 3. 模型架构 ​​​​​​​3.1 Positional Embedding ​​​​​​​3.2 Multi-Head Attention ​​​​​…

[UE虚幻引擎] DTSpeechVoice 文字转语音播放 插件说明

本插件可以在UE中使用蓝图把文本转成语音播放,播放的声音引擎是使用Windows自带的语音引擎,支持Win10,Win11。 系统设置 首先确认电脑是否有语音系统,一般正常安装的电脑都是自带的。 如果要播放多语言的,请自己下载其…

突发!OpenAI停止不支持国家API,7月9日开始执行

6月25日凌晨,有部分开发者收到了OpenAI的信,“根据数据显示,你的组织有来自OpenAl目前不支持的地区的API流量。从7月9日起,将采取额外措施,停止来自不在OpenAI支持的国家、地区名单上的API使用。” 但这位网友表示&am…

【宠粉赠书】SQLServer2022:从入门到精通

为了回馈粉丝们的厚爱,今天小智给大家送上一套数据库学习的必备书籍——《SQL Server 2022从入门到精通》。下面我会详细给大家介绍这套图书,文末留有领取方式。 图书介绍 《SQL Server 2022从入门到精通》系统全面地介绍SQL Server 2022数据库应用与开…

文献阅读:通过双线性建模来破译神经元类型连接的遗传密码

文献介绍 文献题目 Deciphering the genetic code of neuronal type connectivity through bilinear modeling 研究团队 Mu Qiao(美国加州理工学院) 发表时间 2024-06-10 发表期刊 eLife 影响因子 7.7 DOI 10.7554/eLife.91532.3 摘要 了解不同神经元…

【C++STL】Vector扩容机制

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;c系列专栏&#xff1a;C/C零基础到精通 &#x1f525; 给大…

“Hello, World!“ —— 初学者进入编程世界的第一步

布莱恩W.克尼汉&#xff08;Brian W. Kernighan&#xff09;—— Unix 和 C 语言背后的巨人 布莱恩W.克尼汉 布莱恩W.克尼汉在 1942 年出生在加拿大多伦多&#xff0c;他在普林斯顿大学取得了电气工程的博士学位&#xff0c;2000 年之后取得普林斯顿大学计算机科学的教授教职。…

SpringBoot开启事务日志

一般框架开启日志的方式&#xff1a; 开启某个包下的日志就写该包路径&#xff0c;开启某个类下的日志就写该类路径。

3d渲染软件有哪些(1),渲染100邀请码1a12

3D渲染是把三维模型转成2D图像的过程&#xff0c;领域不同常用的软件也不一样&#xff0c;今天我们就简单介绍几个。 在介绍前我们先推荐一个设计人员常用到的工具&#xff0c;就是网渲平台渲染100&#xff0c;通过它设计师可以把本地渲染放到云端进行&#xff0c;价格也不贵&a…

PCL笔记二 之VS环境配置(不同版本Debug+Release编译)

PCL笔记二 之VS环境配置&#xff08;不同版本DebugRelease编译&#xff09; PCL官网&#xff1a;https://github.com/PointCloudLibrary/pcl/releases众所周知&#xff0c;PCL是一个用于点云处理并且依赖不少三方库的一个算法库&#xff0c;同时在编译配置环境时也很复杂&…

【嵌入式DIY实例】-Nokia 5110显示BME280传感器数据

Nokia 5110显示BME280传感器数据 文章目录 Nokia 5110显示BME280传感器数据1、硬件准备与接线2、代码实现本文将介绍如何使用 ESP8266 NodeMCU 板(ESP12-E 模块)和 BME280 气压、温度和湿度传感器构建一个简单的本地气象站。 NodeMCU 从 BME280 传感器读取温度、湿度和压力值…