【Ubuntu】Ubuntu server 18.04 搭建Slurm并行计算环境(包含NFS)

Ubuntu server 18.04 搭建Slurm并行计算环境(包含NFS)

一、Munge 认证模块

1.1、安装 munge

主节点和子节点都安装munge

#安装
sudo apt update && sudo apt install munge libmunge-dev

#设置开机启动
sudo systemctl enable munge
sudo systemctl start munge

#验证安装
munge -V
sudo systemctl status munge

在这里插入图片描述

1.2、配置munge

主节点配置

#生成统一key
sudo create-munge-key
#设置munge.key访问权限
sudo chmod 1777 /etc/munge

子节点配置

#设置munge.key访问权限
sudo chmod 1777 /etc/munge
#删除自动生成的munge.key
rm -rf /etc/munge/munge.key
#从主节点获取/etc/munge/munge.key
sudo scp master@ipaddress:/etc/munge/munge.key /etc/munge
#设置munge.key文件访问权限
sudo chown munge:munge /etc/munge/munge.key
sudo chmod 400 /etc/munge/munge.key
#子节点重启
sudo systemctl restart munge
sudo systemctl status munge
#验证是否和主节点执行结果一致
munge -n

在这里插入图片描述

常见报错:权限问题,sudo chown munge:munge /etc/munge/munge.key && sudo chmod 400 /etc/munge/munge.key

在这里插入图片描述

二、安装NFS文件共享模块

2.1、NFS服务器端配置

# 安装nfs服务端
sudo apt update && sudo apt install nfs-kernel-server

# 配置NFS服务端共享目录,并设置公共访问权限
sudo mkdir -p /nfs
sudo chown nobody:nogroup /nfs  

# 修改NFS服务端配置文件,并使配置生效
sudo vim /etc/exports
sudo exportfs -a

#添加如下内容
/nfs *(rw,sync,no_subtree_check,fsid=0,crossmnt)

在这里插入图片描述

# 启动nfs服务,并设置开机自启
sudo systemctl start nfs-kernel-server
sudo systemctl enable nfs-kernel-server

2.2、NFS客户端配置

# 安装NFS客户端
sudo apt update && sudo apt install nfs-common

# 创建与NFS服务端相同的共享目录
sudo mkdir -p /nfs

# 挂载共享目录
sudo mount 192.168.1.xxx(NFS服务端ip地址):/nfs /nfs

# 修改客户端配置文件
sudo vim /etc/fstab

# 添加如下内容
192.168.1.xxx(NFS服务端ip地址):/nfs /nfs nfs defaults 0 0

在这里插入图片描述

验证NFS配置:在NFS服务端的共享目录中创建文件,在NFS客户端的挂载目录查看是否有相同文件

在这里插入图片描述

二、Slurm作业调度模块

2.1、Slurm控制节点配置

 # 安装配置文件
 sudo apt install slurm-wlm slurm-wlm-doc -y
 
 # 准备生成slurm配置文件
 dpkg -L slurmctld | grep html
 cd /usr/share/doc/slurmctld/

在这里插入图片描述

# 生成server页面,可视化生成配置文件
python3 -m http.server

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

# 启动slurm,并设置开机自启
sudo systemctl start slurmctld
sudo systemctl enable slurmctld

# 验证
sinfo
sudo systemctl status slurmctld

在这里插入图片描述

2.2、Slurm计算节点配置

# 安装slurm
sudo apt install slurm-wlm slurm-wlm-doc -y

# 复制控制节点的配置文件 /etc/slurm-llnl/slurm.conf 到 计算节点
ll /etc/slurm-llnl

# 启动slurm,并设置开机自启
sudo systemctl start slurmd
sudo systemctl enable slurmd

# 验证
sudo systemctl status slurmd

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/945416.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SELECT 语句用法大全:数据库查询的核心力量

在数据库的世界中,SELECT 语句犹如一把万能钥匙,开启了数据检索的大门,让我们能够从海量的数据中精准地获取所需的信息。它的用法丰富多样,涵盖了从简单的数据查看,到复杂的数据统计和关联查询等多个方面,为…

小程序配置文件 —— 14 全局配置 - tabbar配置

全局配置 - tabBar配置 tabBar 字段:定义小程序顶部、底部 tab 栏,用以实现页面之间的快速切换;可以通过 tabBar 配置项指定 tab 栏的表现,以及 tab 切换时显示的对应页面; 在上面图中,标注了一些 tabBar …

计算机网络 (8)物理层的传输方式

一、串行传输与并行传输 串行传输 定义:串行传输是一种数据传输方式,指的是逐位地按照顺序传输数据。在串行传输中,数据位逐个按照一定的顺序进行传输,可以通过单条线路或信道进行。特点: 逐位传输:串行传输…

Edge如何获得纯净的启动界面

启动Edge会出现快速链接,推广链接,网站导航,显示小组件,显示信息提要,背景 ●复杂页面 ●精简页面 点击页面设置按钮 关闭快速链接 关闭网站导航 关闭小组件 关闭信息提要 关闭背景 关闭天气提示 精简页面看起来十分舒…

细说STM32F407单片机CAN基础知识及其HAL驱动程序

目录 一、CAN总线结构和传输协议 1、 CAN总线结构 (1)闭环结构的CAN总线网络 (2)开环结构的CAN总线网络 (3)隐性电平和显性电平 2、CAN总线传输协议 (1)CAN总线传输特点 &am…

计算机的错误计算(一百九十六)

摘要 用两个大模型计算 arccos(0.444). 结果保留 4位有效数字。两个大模型的计算结果相同,并均有误差。 例1. 计算 arccos(0.444). 结果保留 4位有效数字。 下面是与一个大模型的对话。 以上为与一大模型的对话。 下面是与另一大模型的对话。 点评: &…

打印进度条

文章目录 1.Python语言实现(1)黑白色(2)彩色:蓝色 2.C语言实现(1)黑白颜色(2)彩色版:红绿色 1.Python语言实现 (1)黑白色 import sys import timedef progress_bar(percentage, width50):"""打印进度条:param percentage: 当前进度百分比…

Fiddler断点(拦截)--篡改请求后或者响应前数据

目录 一、断点介绍 图例 简单介绍: 详细介绍: 二、操作步骤 文章操作资源下载 (一)设置要抓包的地址 (二)全局拦截(断点) 1.请求后拦截(Before Request) 解开拦截 2.响应前拦截(After Responses&#xff…

【ArcGIS Pro/GeoScene Pro】可视化时态数据

可视化过去二十年新西兰国际旅游业的发展变化 工程数据下载 ArcGIS Pro 快速入门指南—ArcGIS Pro | 文档 添加数据 数据为中国旅客数据 转置表字段 列数据转行数据

【基础篇】三、MySQL表结构的操作

文章目录 Ⅰ. 创建表1、语法2、创建表样例3、创建和其它表一样结构的表 Ⅱ. 查看表结构1、查看数据库中的表2、查看指定表的属性3、获取表的创建语句 Ⅲ. 删除表Ⅳ. 修改表结构1、向表中插入新的字段2、删除表中的字段3、修改表名4、修改字段属性 Ⅰ. 创建表 1、语法 create …

小程序租赁系统开发的优势与应用探索

内容概要 在如今这个数码科技飞速发展的时代,小程序租赁系统开发仿佛是一张神奇的魔法卡,能让租赁体验变得顺畅如丝。想象一下,无论你需要租用什么,从单车到房屋,甚至是派对用品,只需动动手指,…

ArcGIS教程(009):ArcGIS制作校园3D展示图

文章目录 数据下载校园3D展示图制作创建要素类矢量化【楼】要素矢量化【绿地】矢量化【范围】矢量化处理打开ArcScene添加动画数据下载 https://download.csdn.net/download/WwLK123/90189025校园3D展示图制作 创建要素类 添加底图: 新建【文件地理数据库】,并修改名称为【…

Secured Finance 与 Parasail 在流动性质押领域开展合作

Secured Finance 宣布与 Parasail 达成战略合作,标志着生态在推进 DePIN 及人工智能生态系统能力的重要里程碑。此次合作将 Parasail 卓越的质押方案与 Secured Finance 在去中心化贷款和稳定币协议方面的专业能力相结合,为 Filecoin 生态系统内的创新金…

pytorch基础之注解的使用--003

Title 1.学习目标2.定义3.使用步骤4.结果 1.学习目标 针对源码中出现一些注解的问题,这里专门写一篇文章进行讲解。包括如何自定义注解,以及注意事项,相信JAVA中很多朋友业写过,但是今天写的是Python哦。。。 2.定义 在 Python…

!倒序数 !

时间限制:C/C 1000MS,其他语言 2000MS 内存限制:C/C 256MB,其他语言 512MB 难度:中等 分数:100 OI排行榜得分:12(0.1*分数2*难度) 描述 输入一个非负整数,输出这个数的倒序数。例如…

【Redis】Redis 典型应用 - 缓存 (cache)

目录 1. 什么是缓存 2. 使用 Redis 作为缓存 3. 缓存的更新策略 3.1 定期生成 3.2 实时生成 4. 缓存的淘汰策略 5. 缓存预热, 缓存穿透, 缓存雪崩 和 缓存击穿 关于缓存预热 (Cache preheating) 关于缓存穿透 (Cache penetration) 关于缓存雪崩 (Cache avalanche) 关…

《燕云十六声》d3dcompiler_47.dll缺失怎么解决?

一、d3dcompiler_47.dll缺失的原因 系统更新或升级:Windows系统的更新可能会更改或删除某些旧版本的DirectX组件,包括d3dcompiler_47.dll。游戏安装不完整:游戏安装过程中可能出现中断或错误,导致某些必要的文件未能正确安装。软…

RT-Thread中堆和栈怎么跟单片机内存相联系

现在RT-ThreadMCU的应用方式越来越普遍,RT-Thread需要配置MCU中的RAM到的系统中,进入系统内存管理,才能提供给基于实时系统的应用程序使用,比如给应用程序提供malloc、free等函数调用功能。在嵌入式软件开发中,我们经常…

Qt https请求报错SSL handshake failed 解决思路方法

先执行下面代码 qDebug() << manager.supportedSchemes();bool bSupp QSslSocket::supportsSsl();auto buildVersion QSslSocket::sslLibraryBuildVersionString();QString version QSslSocket::sslLibraryVersionString();qInfo() << bSupp << buildVers…

从CW32L010看HAL库封装方式

原文地址&#xff1a;从CW32L010看HAL库封装方式