【GAT】 代码详解 (1) 运行方法【pytorch】可运行版本

请添加图片描述

GRAPH ATTENTION NETWORKS 代码详解

  • 前言
  • 0.引言
  • 1. 环境配置
  • 2. 代码的运行
    • 2.1 报错处理
    • 2.2 运行结果展示
  • 3.总结

前言

在前文中,我们已经深入探讨了图卷积神经网络和图注意力网络的理论基础。还没看的同学点这里补习下。接下来,将开启一个新的阶段,我们将借助强大的深度学习框架PyTorch,通过实战讲解来展示如何构建和训练一个GAT模型。这一过程不仅帮助读者巩固理论知识,更重要的是,它将引导读者从理论迈向实践,实现在处理具有图结构数据的问题上的质的飞跃。

在本章节中,我将主要介绍如何运行代码以获取计算结果。考虑到我的读者中有很多是初学者,我认为在深入探讨代码的各种细节之前,首先了解如何简单地运行模型并查看其结果是非常必要的。这不仅可以帮助读者迅速掌握操作,还能使他们对模型的工作流程有一个直观的认识。

这个原文的代码地址感兴趣的读者自行下载即可 https://github.com/2578562306/pyGAT

在这里插入图片描述

😃当然要是觉得还不错的话,烦请点赞,收藏➕关注👍

0.引言

这是 Veličković 等人在 2017 年提出的图注意力网络(GAT)模型的 PyTorch 实现(https://arxiv.org/abs/1710.10903)。该代码库最初从 https://github.com/tkipf/pygcn 分叉而来。GAT 的官方仓库(采用 TensorFlow 实现)可以在 https://github.com/PetarV-/GAT 找到。目前网络上的主流讲解基本都是以这些版本的代码为基础,因此,我们将依据这些代码深入探索 GAT,了解图神经网络中如何实现注意力机制的能力。

重要说明==此外,本 PyTorch 实现与原始的 TensorFlow 版本(见此链接)存在一些细微差异。当前的 PyTorch 版本主要旨在进行概念验证,并非旨在完全复现原论文中报告的结果。因此,复现出来的结果与原始论文中的结果存在一定的差距。在对当前代码进行讲解之后,作者将分析这些差异,并指导大家如何复原文中的实验结果。==该实现使用的是 Cora 数据集,其主要被分成了两个文件。具体细节将在下一章节的代码分析部分进行详细说明。

1. 环境配置

如果您已经配置好相关环境,可以跳过本部分。

对于计划在特定环境下运行图注意力网络(GAT)的开发者而言,了解并设置正确的系统要求是至关重要的初步步骤。以下详述了系统和软件环境的要求,以确保GAT可以被正确安装并顺利运行。

必需的软件和库:

  • PyTorch: 需要安装的版本为0.4.1。PyTorch是执行深度学习模型的核心库,尤其是在本实现中的图注意力网络(GAT)。
  • Python: 支持的版本为3.5。Python是运行这一图注意力网络代码的基本环境。由于使用了torch.sparse_coo_tensor,我们依赖特定版本的PyTorch和Python。

Python包依赖:
正确安装以下Python包是确保模型正常运行的前提条件。您可以通过运行下列命令来安装或检验这些依赖是否正确安装:

这里你可以插入具体安装依赖的命令,其中模型还是用到numpy和scipy的库,可以通过使用pip安装:

pip install numpy
pip install scipy

请确保所有的环境配置都符合要求,以便无障碍地运行和应用图注意力网络。

使用 Python 开发环境中需要使用外部库,如 numpy, torch, 和 scipy 等时,可以通过 pip 命令来安装这些库。pip 是 Python 的官方包管理系统,用于安装和管理软件包,这些包通常来自于 Python 包索引(PyPI),它是一个集中存放 Python 程序包的仓库。

如何使用 pip 在命令行中安装软件包???????:

  1. 打开命令行工具

    • 在 Windows 上,可以打开命令提示符或 PowerShell。
    • 在 macOS 或 Linux 上,可以打开终端。
  2. 输入安装命令

    • 在命令行中输入 pip install 包名 命令。例如,要安装 Numpy,就输入 pip install numpy
  3. 执行命令

    • 按回车键,pip 将自动从 PyPI 下载并安装该软件包及其依赖。

安装多个包

  • 如果要一次安装多个包,可以在同一命令行中列出所有包,用空格隔开。例如:pip install numpy torch scipy

此过程将在您的系统上安装指定的 Python 库,允许您在任何 Python 脚本或项目中导入并使用这些库。

注意事项:

  • 确保您的网络连接畅通,因为 pip 需要从互联网下载包。
  • 在某些情况下,如果默认的 pip 安装的不是针对您当前使用的 Python 版本,可能需要使用 pip3 替代 pip
  • 根据您的系统设置,可能需要管理员权限来安装包。在这种情况下,您可能需要在命令前加上 sudo(适用于 Linux 和 macOS),例如 sudo pip install numpy

通过以上步骤,您可以轻松地通过 pip 在任何支持的开发环境中安装和管理 Python 包,从而为开发工作提供必要的库支持。

大家很多同学都用 Jupyter Notebook 或 Visual Studio Code(VSCode)进行 Python 开发时,使用 pip 安装库同样是一个简单且有效的方式。以下是在这两种开发环境中安装 Python 库的详细步骤:

在 Jupyter Notebook 中安装库:

  1. 打开 Jupyter Notebook

    • 通常通过在终端中输入命令 jupyter notebook 来启动 Jupyter Notebook。
  2. 创建或打开一个笔记本

    • 在 Jupyter 的主界面,可以选择“New”(新建)然后选择“Python X”(X代表版本号)来创建一个新的笔记本。
  3. 安装库

    • 在笔记本的一个新单元中输入安装命令,例如:
      !pip install numpy
      
    • 执行单元格(按 Shift + Enter),这条命令将会在你的 Python 环境中安装 NumPy 库。

在 Visual Studio Code(VSCode)中安装库:

  1. 打开或创建一个 Python 文件

    • 在 VSCode 中打开你正在工作的项目或者新建一个 Python 文件。
  2. 打开终端

    • 在 VSCode 中,你可以通过点击顶部菜单的 “View”(视图) > “Terminal”(终端)来打开一个新的终端。或者使用快捷键 Ctrl+` (反引号)打开或切换终端。
  3. 执行安装命令

    • 在打开的终端中,输入如下的命令来安装所需的库,例如:
      pip install numpy
      
    • 按 Enter 执行,该命令将会为你的 Python 环境安装库。

在两种情况下,你都可以通过类似的方式安装任何需要的库。只需将 numpy 替换为你需要安装的库的名称即可。确保你已经配置好了 Python 和 pip。 在 VSCode 或 Jupyter Notebook 中,你可以通过这种方式方便地管理 Python 包,以满足开发需求。这使得使用这些工具进行科学计算和开发成为一件高效且愉快的事情。

2. 代码的运行

在这里我仅仅展示如何修改代码保证模型的正确运行,下面是代码的文件划分:

请添加图片描述

文件名称还是很直接的,模型使用的数据和上一节中GCN使用的一致,在这里不讨论。output输出文件仅仅是用来存放可视化结果的这里要执行代码仅仅需要修改utils.py文件。

请添加图片描述

细心的同学一定会发现这个内容和GCN中的代码一样,的确这个代码被作者重复用了。造轮子大家用,确实很很爽的一件事。

在这里插入图片描述

这个地址修改成你自己存储数据的目录地址即可。如果你不知道地址在哪里???怎么办???

在这里插入图片描述

都是些很基础的操作,同样在jupyter中打开数据的位置右键也会有复制地址的选项我在这里就不过的赘述了。然后点击train.py文件执行 文件即可。如果是说咱们的有些同学使用的是jupyter那么你还要将代码复制到一个ipynb文件中再执行文件。

请添加图片描述

2.1 报错处理

如果jupyter环境下运行的同学出现报错,那么就多半是这里出现了问题:
在这里插入图片描述
需要对代码修改如下:
在这里插入图片描述
代码我放在这里便于大家直接复制:

args = parser.parse_args(args=[]) 

2.2 运行结果展示

其输出结果与GCN相似,但值得注意的是,每次运行的epoch数量都有所不同。这是因为模型采用了早停机制,在训练过程中一旦满足特定条件即提前终止,以防止过拟合。在下一节的代码详解中,我将详细讲解早停机制的使用方法和它的工作原理。
请添加图片描述

这些数据展示了在训练图注意力网络(GAT)时的各个epoch(训练周期)的性能指标。下面是对这些数据的简单解释:

  • Epoch: 这表示当前的训练周期编号,从0001开始,每个周期均包括向前和向后传播过程。
  • loss_train: 这是训练集上的损失值,反映了模型在训练数据上的表现。损失值越低,表示模型在这组数据上的拟合越好。
  • acc_train: 这是训练集上的准确率,以百分比表示,显示了模型正确分类训练数据的能力。
  • loss_val: 这是验证集上的损失值,用于评估模型在未见过的数据上的泛化能力。在实际应用中,我们希望验证损失与训练损失相近,这表明模型没有过拟合。
  • acc_val: 这是验证集上的准确率,反映了模型在验证数据上的分类准确性。较高的验证准确率表明模型具有较好的泛化性能。
  • time: 这是完成该周期训练所需的时间,以秒为单位。这个时间包括了数据处理、模型计算和反向传播等所有步骤的时间。

从这些数据中可以观察到,随着训练周期的增加,训练和验证的损失通常会逐渐减小,而准确率则逐渐提高。这是模型学习过程的典型表现,表示模型在逐渐适应和理解训练数据。然而,重要的是要监控训练和验证损失之间的差异,以及相应的准确率,以便及时调整训练参数或提前停止训练,防止过拟合。

下面的最终运行结果是我在CPU中实验得到的给各位一个运行的参考:
请添加图片描述

至于这个准确率为和如何之高,[可以参考我这个博文的理解。]。(https://blog.csdn.net/weixin_47332746/article/details/143515332)

3.总结

现阶段,我们已经全面介绍了图注意力网络(GAT)的理论基础及模型的运行方式。在接下来的篇章中,我们将深入探讨该模型及相关论文中的核心架构和代码实现。
这一部分将为对这一主题感兴趣的读者提供一个详细的技术视角,帮助您从基本理论开始,逐步了解模型是如何通过精确的数学建模和编程实现来完成预期的机器学习任务。深入解析模型的主体架构对于理解其工作原理至关重要,对于那些希望在此基础上进行改进或希望自定义该模型以适应特定应用的研究者和开发者而言,尤其具有价值。

如果您对这些内容感兴趣,请不要忘记点赞、收藏并关注。这是对我的工作最大的支持和鼓励。非常感谢您!如果有任何疑问,欢迎随时与我联系。我期待与您的互动!
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/921267.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

redis工程实战介绍(含面试题)

文章目录 redis单线程VS多线程面试题**redis是多线程还是单线程,为什么是单线程****聊聊redis的多线程特性和IO多路复用****io多路复用模型****redis如此快的原因** BigKey大批量插入数据测试数据key面试题海量数据里查询某一固定前缀的key如果生产上限值keys * ,fl…

神经网络问题之二:梯度爆炸(Gradient Explosion)

梯度爆炸(Gradient Explosion)是神经网络训练过程中常见的一个问题,它指的是在反向传播过程中,梯度值变得非常大,超出了网络的处理范围,从而导致权重更新变得不稳定甚至不收敛的现象。 一、产生原因 梯度爆…

小杨的N字矩阵c++

题目描述 小杨想要构造一个m*m 的 N 字矩阵( m为奇数),这个矩阵的从左上角到右下角的对角线、第1 列和第m 列都 是半角加号 ,其余都是半角减号 - 。例如,一个 5*5 的 N 字矩阵如下: --- -- -- -- --- 请…

2024 年企业中的生成式 AI 现状

2024: The State of Generative AI in the Enterprise - Menlo Ventures 企业 AI 格局正在被实时改写。随着试点(Pilot)让位于生产(Production),我们对 600 名美国企业 IT 决策者进行了调查,以揭示新出现的…

Ubuntu24虚拟机-gnome-boxes

推荐使用gnome-boxes, virtualbox构建失败,multipass需要开启防火墙 sudo apt install gnome-boxes创建完毕~

Haystack 的开源开发 LLM 应用设计框架

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

leetcode 919.完全二叉树插入器

1.题目要求: 完全二叉树 是每一层(除最后一层外)都是完全填充(即,节点数达到最大)的,并且所有的节点都尽可能地集中在左侧。设计一种算法,将一个新节点插入到一棵完全二叉树中,并在…

提升性能测试效率与准确性:深入解析JMeter中的各类定时器

在软件性能测试领域,Apache JMeter是一款广泛使用的开源工具,它允许开发者模拟大量用户对应用程序进行并发访问,从而评估系统的性能和稳定性。在进行性能测试时,合理地设置请求之间的延迟时间对于模拟真实用户行为、避免服务器过载…

Python + 深度学习从 0 到 1(00 / 99)

希望对你有帮助呀!!💜💜 如有更好理解的思路,欢迎大家留言补充 ~ 一起加油叭 💦 欢迎关注、订阅专栏 【深度学习从 0 到 1】谢谢你的支持! ⭐ 什么是深度学习? 人工智能、机器学习与…

亚信安全发布《2024年第三季度网络安全威胁报告》

《亚信安全2024年第三季度网络安全威胁报告》的发布旨在从一个全面的视角解析当前的网络安全威胁环境。此报告通过详尽梳理和总结2024年第三季度的网络攻击威胁,目的是提供一个准确和直观的终端威胁感知。帮助用户更好地识别网络安全风险,并采取有效的防…

ROS机器视觉入门:从基础到人脸识别与目标检测

前言 从本文开始,我们将开始学习ROS机器视觉处理,刚开始先学习一部分外围的知识,为后续的人脸识别、目标跟踪和YOLOV5目标检测做准备工作。我采用的笔记本是联想拯救者游戏本,系统采用Ubuntu20.04,ROS采用noetic。 颜…

利用c语言详细介绍下选择排序

选择排序(Selection sort)是一种简单直观的排序算法。它是每次选出最小或者最大的元素放在开头或者结尾位置(采用升序的方式),最终完成列表排序的算法。 一、图文介绍 我们还是使用数组【10,5,3…

candence: 非金属化孔制作

非金属化孔制作 以下面这个RJ45接口为例 1、打开pad designer 只需要设置开始、结束层即可。 保存 来直观看下非金属化孔和金属化孔的区别:

用宏实现简单的计算器

大家好,那么经过我们前面几期的学习,我们对宏有了一定的了解,那么我们今天就来试试实现一个简单的加减乘除运算。 我们的思路是使用三目操作符来分别进行加减和乘除的运算,然后用if判断来”进入相关的判断体进而来进行计算。当然…

Postman之newman

系列文章目录 1.Postman之安装及汉化基本使用介绍 2.Postman之变量操作 3.Postman之数据提取 4.Postman之pm.test断言操作 5.Postman之newman Postman之newman 1.基础环境node安装1.1.配置环境变量1.2.安装newman和html报告组件 2.newman运行 newman可以理解为,没有…

用python简单集成一个分词工具

本部分记录如何利用Python进行分词工具集成,集成工具可以实现运行无环境要求,同时也更方便。 该文章主要是记录,知识点不是特别多,欢迎访问个人博客:https://blog.jiumoz.top/archives/fen-ci-gong-ju-ji-cheng 成品展…

CMake + mingw + opencv

由于是在windows下开发,因此下载的是windows版本的安装程序,如图: 下载的是 MSVC 编译的 OpenCV,但由于我一般使用的是JetBrains的开发工具,并且为了方便跨平台,我一般也是使用cmakemingw编译,这…

11.22 校内模拟赛总结

挂分场 复盘 决定尝试一下多放一点时间在前期看题上 T1 发现是模拟;T2 看上去好神秘啊!想了一会一直没什么思路;T3 看上去眼熟,但还是觉得计数很困难;T4 看完发现是数据结构,推了推很快会了树高做法&…

使用 PyTorch-BigGraph 构建和部署大规模图嵌入的完整教程

当涉及到图数据时,复杂性是不可避免的。无论是社交网络中的庞大互联关系、像 Freebase 这样的知识图谱,还是推荐引擎中海量的数据量,处理如此规模的图数据都充满挑战。 尤其是当目标是生成能够准确捕捉这些关系本质的嵌入表示时,…

如何使用Python代码实现给GPU预加热

如何使用Python代码实现给GPU预加热 一、引言二、使用深度学习框架进行预加热2.1 TensorFlow预加热2.2 PyTorch预加热三、使用CUDA进行预加热四、预加热的效果评估与优化五、结论与展望在高性能计算和深度学习领域,GPU(图形处理器)已经成为不可或缺的加速工具。然而,在实际…