ceph学习笔记

ceph

ceph osd lspools


rbd ls -p testpool


#查看 ceph 集群中有多少个 pool,并且每个 pool 容量及利 用情况
rados df


ceph -s


ceph osd tree
ceph df

ceph versions

ceph osd pool ls

ceph osd crush rule dump

ceph auth print-key client.admin

ceph orch host ls

ceph crash ls

ceph osd pool stats

ceph df detail
ceph osd stat

ceph mon stat

查看image rbd
rbd ls -p kube

ceph osd df
ceph osd pool autoscale-status


ceph: 
10.240.62.11/12/13
root:autelceph2  


用户名:autel
密码:Autonomy@Autel

13 Autel#3913

[root@ceph-admin ~]# ceph mgr services
{
    "dashboard": "https://10.250.53.152:8443/",
    "prometheus": "http://10.250.53.152:9283/"
}



kubectl logs -f qinzhao-cache-resunet-demo-pipeline-wbkkh-2890309351 -n qinzhao -c lustre-importer-preload

kubectl get nodes "-o=custom-columns=NAME:.metadata.name,GPU:.status.allocatable.nvidia\.com/gpu"

apps/jupyter/jupyter-web-app/upstream/base/configs/spawner_ui_config.yaml

 kustomize build apps/jupyter/jupyter-web-app/upstream/overlays/istio | kubectl apply -f -

kustomize build  apps/tensorboard/tensorboard-controller/upstream/overlays/kubeflow | kubectl apply -f -

kubectl get pods -n kubeflow -l kustomize.component=profiles

https://www.amazonaws.cn/ec2/instance-types/

kubectl taint node autel-poweredge-r750 nodetype=T4:NoExecute
kubectl taint node autelrobotics-gpu10 nodetype=RTX3090:NoExecute
autelrobotics-gpu10
kubectl taint node autel-poweredge-r750 nodetype:NoExecute-

 kubectl taint node autelrobotics-gpu09 nodetype:NoSchedule-
 
  kubectl taint node autelrobotics-gpu09 nodetype:NoExecute-
  
  nodegroup=gpu:NoSchedule
  
  kubectl taint nodes autelrobotics-gpu02 nodegroup=gpu:NoSchedule
  
  kubectl label node autelrobotics-gpu02 gputype=A40
  
  lsof -n -P -i:22
  strace

kubectl get csinode
查看活跃进程个数
top -H -p 1

kubectl create secret tls ai-tls \
    --namespace ai-test \
    --key tls.key \
    --cert tls.pem

https://github.com/NVIDIA/nvidia-docker/issues/1678
nvidia-container-cli -k -d /dev/tty info


ls -l /dev/char
cat /etc/nvidia-container-runtime/config.toml

stat -fc %T /sys/fs/cgroup/

sar -n TCP,ETCP 1

 fdisk -l
 ldd
 
 # 修改后,重新挂载生效
# mount -o remount /dev/shm

nstat
mpstat -P all 1
slabtop
pcstat

netstat -ant | awk '{print $6}' | sort | uniq -c | sort -n

dmesg -T
pmap -x  1649 | sort -k 3 -n -r
cat /proc/1649/smaps | grep 7f4250021000
dump memory memory.dump 0x7f2340539000 0x7f235d553000

strings memory.dump

pidstat -p pid -r 1 1000
sudo ./stackcount ip_output

dmesg -Tw
perf
NetHogs

iftop -i eth0 -P -N
./opensnoop -Tn snmp-pass
slabtop

nfsstat -c

du -ah --max-depth=2 /var/log |sort -rh |head -10

./fileslower
ulimit -a


解决显存释放问题:
fuser -v /dev/nvidia*

 lsof -Pni
 
 netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
 

在这里插入图片描述

NFS运维:

systemctl status rpcbind nfs-server
nfsiostat
dmesg | grep nfs
exportfs -v
mpstat -P ALL 1
ss -t -a |grep "IP"

nfsstat -c
iostat 

iostat -d -x -k 1

netstat -an | "IP:2049"

dstat
ps aux | grep /app

https://learnku.com/articles/39851
https://zhuanlan.zhihu.com/p/614314627

 fdisk -l
 blkid
 
 nfsiostat  1
 
 sar -b 1
 
 iostat -m -d /dev/md0 1
 
 strace -p pid 查看进程当前调用栈,查死循环或者卡顿时极为有用
strace -eopen /usr/local/kk-mail/service/dovecot/sbin/dovecot  查看进程当前打开了哪些文件 

cat /proc/715765/*/task/stack

/proc/12544/task/12873/stack
systemtap

cat /var/log/Xorg.0.log |grep -i "nvidia"

ss

sasfa

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/160068.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

搞科研、写论文,如何正确使用GPT?AIGC技术解析、提示词工程高级技巧、AI绘图、ChatGPT/GPT4应用

目录 专题一 OpenAI开发者大会最新技术发展及最新功能应用 专题二 AIGC技术解析 专题三 提示词工程高级技巧 专题四 ChatGPT/GPT4的实用案例 专题五 让ChatGPT/GPT4成为你的论文助手 专题六 让ChatGPT/GPT4成为你的编程助手 专题七 让ChatGPT/GPT4进行数据处理 专题八 …

这就是不创业的最大的原因,机器视觉兄弟们创业要谨慎,为什么99.99%机器视觉公司老板是销售人员?

机器视觉公司,99%公司实行销售优先原则,企业老板99%从销售人员中产生。所以机器视觉兄弟们创业要谨慎。 企业的本质就是通过销售获得利润的组织,销售是立足之本,没有销售,创业就是耍流氓。因此,企业的一切…

CF1899B 250 Thousand Tons of TNT

题目链接 题目 题目大意 T T T 组测试数据 每组 n n n 个货物,第 i i i 个货物 的重量是 a i a_i ai​ 用k辆货车按顺序装这些货物,条件是每辆车上的货物个数都一样,也即是说 n n n 必须能被 k k k 整除, 求任意两辆车货物总…

Redis 访问控制列表(ACL)

Redis ACL 关于 Redis ACL与旧版本兼容ACL helpACL 配置模式redis.conf 配置模式外部 ACL File 配置模式 ACL 规则总结 关于 Redis ACL Redis ACL (访问控制列表) 是 Access Control List 的缩写,它允许某些连接在可以执行的命令和可以访问的密钥方面受到限制。它…

代码随想录算法训练营第五十八天丨 动态规划part18

739. 每日温度 思路 首先想到的当然是暴力解法,两层for循环,把至少需要等待的天数就搜出来了。时间复杂度是O(n^2) 那么接下来在来看看使用单调栈的解法。 什么时候用单调栈呢? 通常是一维数组,要寻找任一个元素的右边或者左边…

智能配电房管理系统

智能配电房管理系统依托电易云-智慧电力物联网,是一种集成了互联网、物联网、大数据、人工智能等先进技术的管理系统,专门用于配电房的智能化管理和运维。以下是智能配电房管理系统的主要功能和特点: 一、主要功能: 实时监测与数据…

SQL 的 AND、OR 和 NOT 运算符:条件筛选的高级用法

AND 运算符 SQL的AND运算符用于根据多个条件筛选记录,确保所有条件都为TRUE才返回记录。下面是AND运算符的基本语法: SELECT column1, column2, ... FROM table_name WHERE condition1 AND condition2 AND condition3 ...;column1, column2,等是您要选…

Go 语言数组基础教程 - 数组的声明、初始化和使用方法

数组用于在单个变量中存储相同类型的多个值,而不是为每个值声明单独的变量。 声明数组 在Go中,有两种声明数组的方式: 使用var关键字: 语法 var array_name [length]datatype{values} // 这里定义了长度 或者 var array_n…

Typora for Mac:打造全新文本编辑体验

Typora for Mac是一款与众不同的文本编辑器,它不仅拥有直观易用的界面,还融合了Markdown语法和富文本编辑的功能,为用户带来了前所未有的写作和编辑体验。 一、简洁明了的界面设计 Typora for Mac的界面简洁明了,让用户可以专注…

【科技素养】蓝桥杯STEMA 科技素养组模拟练习试卷F

1、常见的加密算法可以分为对称加密算法和非对称加密算法,以下关于它们的描述正确的是 A、AES是一种常见的非对称加密算法 B、凯撒密码是一种非对称加密 C、非对称加密算法的解密使用的秘钥与加密不同 D、对称加密算法无法被暴力破解 答案:C 2、12根…

我为什么开始写技术博客

今天没有技术文章,只是想聊聊认真做CSDN和公众号以来的一些感想。 1.为什么开启技术分享 我不算是一个聪明的人,没有过目不忘的本事,所以从工作开始就养成了做笔记的习惯; 最开始15、16年做模型开发,那时候环境其实就…

LINUX入门篇【6】----第一个LINUX小程序---进度条及相关知识讲解

前言: 本篇我们将开始尝试构建我们的第一个LINUX的小程序----进度条作为一个十分常见的程序,在我们之后的工程实践中也是需要多次运用,但是介于我们目前还没有去学习网络等方面的知识,没法独立的去利用程序去下载一个真正的程序&…

Humanoid Robotics Whole Body Control(WBC)全身控制

系列文章目录 文章目录 系列文章目录前言一、ROS —— 什么是全身控制?二、IEEE - RAS三、维也纳工业大学 —— 自动化与控制研究所(ACIN)四、IIt(意大利技术研究院) 前言 谷歌的几种解释 一、ROS —— 什么是全身控制…

PPT基础入门

目录 相关设置快捷键shift 快捷键Ctrl 快捷键Ctrl Shift 组合快捷键快捷键总结 相关设置 设置撤回次数 自动保存 图片压缩 字体嵌入:目的是在不同的电脑上保留已经设置好的字体 多格式导出 (1)可以导出PDF (2)可以导…

简单线性回归函数

简单线性回归函数 定义术语理解简单线性回归例子 定义 线性回归:利用线性回归方程中最小平方函数对一个或多个自变量和因变量之间关系进行建模的一个回归分析。该建模的目标为找到各个系数的最佳值让预测误差最小 简单线性回归:只有一个自变量的线性回…

2023.11.18 每日一题(AI自生成应用)【C++】【Python】【Java】【Go】 动态路径分析

目录 一、编程挑战:动态时间序列分析 实际应用: 实现提示: 二、实现 1. C 2. Python 3. JAVA 4. Go 一、编程挑战:动态时间序列分析 问题描述: 假设你是一名软件工程师,需要开发一个应用来分析和预…

贝茄莱BR AS实时数据采集功能

实时数据采集功能在PLC系统调试过程中,有助于调试人员对变量变化进行监测,通过波形对比,反应不同变量间的相互作用。该测试目的在于验证贝加莱系统组态软件的实时数据采集功能。 贝加莱系统组态软件提供Trace功能,连接PLC&#x…

如何在远程协同视频会议中确保安全性?

随着远程工作的普及,远程协同视频会议已成为企业和团队之间进行交流和协作的重要工具。与此同时,会议中的安全性问题也日益凸显。本文将介绍如何在远程协同视频会议中确保安全性,主要包括以下方面: 1、内网部署 将会议服务器部署…

基于SpringBoot+Redis的前后端分离外卖项目-苍穹外卖(五)

公共字段自动填充 1.1 问题分析1.2 实现思路1.3 代码开发1.3.1 步骤一1.3.2 步骤二1.3.3 步骤三 1.4 功能测试 1.1 问题分析 在前面我们已经完成了后台系统的员工管理功能和菜品分类功能的开发,在新增员工或者新增菜品分类时需要设置创建时间、创建人、修改时间、修…

【开源】基于Vue和SpringBoot的婚恋交友网站

项目编号: S 057 ,文末获取源码。 \color{red}{项目编号:S057,文末获取源码。} 项目编号:S057,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 会员管理模块2.3 新…