k8s学习--kubernetes服务自动伸缩之水平收缩(pod副本收缩)VPA详细解释与安装

文章目录

  • 前言
  • VPA简介
    • 简单理解
    • 详细解释
      • VPA的优缺点
        • 优点
          • 1.自动化资源管理
          • 2.资源优化
          • 3.性能和稳定性提升
          • 5.成本节约
          • 6.集成性和灵活性
        • 缺点
          • 1.Pod 重启影响可用性
          • 2.与 HPA 冲突
          • 3.资源监控和推荐滞后:
          • 4.实现复杂度:
      • 核心概念
        • Resource Requests 和 Limits
        • 自动调节
      • VPA 的工作原理
      • VPA 组件
      • VPA 使用场景
  • 应用
    • 环境
      • 1.部署metrics-server及VPA
        • (1)部署metrics-server
        • (2)升级openssl(所有节点)
        • (3)部署VPA
        • 2.VPA策略


前言

有任何疑问或不懂的地方均可评论或私信,欢迎交流

VPA简介

官方链接
https://github.com/kubernetes/autoscaler/tree/master/vertical-pod-autoscaler

简单理解

与HPA类似,区别在于HPA自动控制的pod副本数量
而VPA则自动控制的是CPU 和 内存 的requests,从而允许在节点上进行适当的调度,以便为每个 Pod 提供适当的资源。

注: 不能与HPA(Horizontal Pod Autoscaler )一起使用

这个是博主写的有关HPA的博客,有兴趣的可以看看
链接: HPA详细解释与应用

详细解释

在 Kubernetes(k8s)中,Vertical Pod Autoscaler(VPA)是一种自动调节 Pod 中容器资源请求(CPU 和内存)的工具。它可以根据 Pod 的实际使用情况自动调整这些资源请求,以确保应用程序具有足够的资源运行,并同时避免资源的浪费。

VPA的优缺点

优点
1.自动化资源管理

简化运维:VPA 自动调整 Pod 的资源请求,减少手动调整的工作量。
动态响应:能实时根据实际资源使用情况调整请求,适应负载变化。

2.资源优化

避免资源浪费:确保 Pod 只请求所需的资源,降低不必要的资源分配。
提高资源利用率:通过优化资源请求,增加集群中可用资源的数量,提高整体资源利用率。

3.性能和稳定性提升

防止资源不足:自动增加资源请求,确保应用在高负载时也能正常运行。
优化性能:通过合理的资源配置,确保应用程序性能得到保障。

5.成本节约

降低运营成本:通过精准的资源配置,减少过度配置带来的成本,提高资源利用效率。

6.集成性和灵活性

兼容性好:VPA 可以与 Kubernetes 中的其他工具(如 HPA)一起使用,以实现全面的自动扩展策略。
可配置性强:提供多种更新策略(如 Auto、Recreate、Initial),适应不同的应用场景。

缺点
1.Pod 重启影响可用性

重启开销:资源请求的更新通常需要重启 Pod,这可能会导致服务短暂不可用,影响用户体验。
滚动更新问题:在滚动更新过程中,如果频繁调整资源请求,可能会导致更新过程复杂化。

2.与 HPA 冲突

配置复杂
同时使用 VPA 和 Horizontal Pod Autoscaler (HPA) 时,可能会产生冲突,需要谨慎配置和管理。
负载模式不同
HPA 和 VPA 针对不同的负载模式(水平扩展 vs. 垂直扩展),混用时需要综合考虑应用负载特性。

3.资源监控和推荐滞后:

数据滞后 :VPA 基于历史资源使用数据做出推荐,可能存在一定的滞后性,无法实时反映最新的负载变化。
推荐准确性:在负载波动剧烈的情况下,推荐值可能不够准确,导致资源配置不够理想。

4.实现复杂度:

依赖数据质量:VPA 的推荐依赖于准确的资源使用数据,集群监控和数据收集的质量对 VPA 的效果有直接影响。
维护复杂度:需要对 VPA 本身进行维护和监控,确保其正常运行和推荐的准确性。

核心概念

Resource Requests 和 Limits

Requests
容器启动时所需的最小资源量,Kubernetes 会基于 requests 来做调度决策。
Limits
容器能使用的最大资源量,防止单个容器使用过多资源。


自动调节

Vertical Scaling:不同于水平扩展(Horizontal Scaling)通过增加 Pod 数量来应对负载,垂直扩展(Vertical Scaling)是调整单个 Pod 的资源配额。

VPA 的工作原理

监控:VPA 通过监控 Pod 的实际资源使用情况来确定是否需要调整资源请求。
推荐:基于历史数据和当前使用情况,VPA 会生成资源请求的推荐值。
更新:VPA 可以自动更新 Pod 的资源请求,触发 Pod 重启使配置生效。

更新策略可以配置为以下几种:
Auto:自动更新 Pod。
Recreate:删除并重新创建 Pod。
Initial:只在 Pod 初始创建时设置资源请求。

VPA 组件

Recommender:收集资源使用数据并生成资源请求的推荐值。
Updater:负责执行资源请求的更新,可以根据策略决定是否重启 Pod。
Admission Controller:在 Pod 创建和更新时应用资源请求的推荐值。

VPA 使用场景

应用负载变化:适合那些资源需求动态变化的应用。
节省成本:通过合理配置资源请求和限制,避免资源浪费。
提高稳定性:确保应用有足够的资源应对高负载情况。

应用

环境

虚拟机

Ip主机名cpu内存硬盘
192.168.10.11master012cpu双核4G100G
192.168.10.12worker012cpu双核4G100G
192.168.10.13worker022cpu双核4G100G

版本 centos7.9
已部署k8s-1.27

1.部署metrics-server及VPA

(1)部署metrics-server

master上操作

wget https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/high-availability-1.21+.yaml

kubelet 证书需要由集群证书颁发机构签名

(或者通过向 Metrics Server 传递参数 --kubelet-insecure-tls 来禁用证书验证)。

更改文件

vim high-availability-1.21+.yaml

149行添加
在这里插入图片描述
解释
因为是虚拟机环境,这条命令是允许 kubelet 使用不安全的 TLS 连接,生产环境不建议使用,这里是便于快速部署和测试已看到效果。

kubectl apply -f high-availability-1.21+.yaml 
watch kubectl get pods -n kube-system 

耐心等待,如果一直起不来就先删除pod再重启个节点docker。
在这里插入图片描述

kubectl top nodes

在这里插入图片描述

kubectl top pods -n kube-system

在这里插入图片描述
这里就部署好了

(2)升级openssl(所有节点)
curl -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
yum install -y openssl-devel openssl11 openssl11-devel

检查下载的 OpenSSL新库版本

openssl11 version

在这里插入图片描述
查看旧版本路径

which openssl

在这里插入图片描述

查看新版本路径

which openssl11

在这里插入图片描述
删除系统默认版本,并创建一个软连接指向新版本

rm -rf `which openssl`
ln -s /usr/bin/openssl11 /usr/bin/openssl

查看默认版本,可以看到已经是新版本了

openssl version

在这里插入图片描述

(3)部署VPA

master节点

mkdir vpa
cd vpa
git clone https://github.com/kubernetes/autoscaler.git
cd autoscaler/vertical-pod-autoscaler/
ls hack/
bash ./hack/vpa-up.sh
cd ..
kubectl get pods -n kube-system

没有running就等一会
在这里插入图片描述
这样就好了

2.VPA策略

在VPA中,updateMode 是一个重要的配置选项,它决定了VPA如何应用其提供的资源建议。根据不同的设置,VPA可以采取不同的策略来更新Pod的资源配置:

Off
VPA不会应用任何资源推荐,只是收集和显示数据。

Initial:
VPA只会在Pod创建时应用资源推荐。一旦Pod启动,即使后续有新的资源推荐,也不会再进行调整。

Recreate:
当VPA生成新的资源推荐时,它会终止当前的Pod并重新创建一个新的Pod,新Pod将采用最新的资源推荐。这种方式会导致服务短暂中断,但能确保立即应用新的资源设置。

Auto:
这是默认模式。在这种模式下,VPA会尝试在线调整运行中的Pod的资源请求和限制,而无需重启Pod。如果无法在线调整(例如,由于内核或Kubernetes版本的限制),则会选择重新创建Pod。

由于篇幅过长,关于模式的演示会单独出(水)一篇博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/693713.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【MySQL】(基础篇三) —— 创建数据库和表

管理数据库和表 管理数据库 创建数据库 在MySQL中,创建数据库的SQL命令相对简单,基本语法如下: CREATE DATABASE 数据库名;如果你想避免在尝试创建已经存在的数据库时出现错误,可以添加 IF NOT EXISTS 子句,这样如…

AI 边缘计算平台 - 6 TOPS 低功耗 RK3576

RK3576 是瑞芯微第二代 8nm 高性能 AIOT 平台,CPU 采用八核大小核构架(4A72 2.2GHz 4A53 1.8GHz),以及一个 M0 协处理器。其 CPU 算力高达 58K DMIPS,足以应对各种复杂计算任务。搭载 Mali-G52 MC3 GPU,14…

vscode软件上安装 Fitten Code插件及使用

一. 简介 前面几篇文章学习了 Pycharm开发工具上安装 Fitten Code插件,以及 Fitten Code插件的使用。 Fitten Code插件是是一款由非十大模型驱动的 AI 编程助手,它可以自动生成代码,提升开发效率,帮您调试 Bug,节省…

【CS.AI】GPT-4o:重新定义人工智能的新标杆

文章目录 1 序言2 GPT-4o的技术亮点3 GPT-4o与前代版本的对比3.1 热门AI模型对比表格GPT-3.5GPT-4GPT-4oBERTT5 3.2 其他 4 个人体验与感受5 结论 1 序言 嘿,大家好!今天要聊聊一个超级酷的AI新突破——GPT-4o!最近,OpenAI发布了…

【报文数据流中的反压处理】

报文数据流中的反压处理 1 带存储体的反压1.1 原理图1.2 Demo 尤其是在NP芯片中,经常涉及到报文的数据流处理;为了防止数据丢失,和各模块的流水处理;因此需要到反压机制; 反压机制目前接触到的有两种:一是基…

ARM功耗管理框架之SCP

安全之安全(security)博客目录导读 目录 一、功耗管理框架中的SCP 二、SCP的示例 三、SCP固件 四、SCP启动流程 五、SCP的memory map 六、SCP与AP的通信 思考:功耗管理框架?SCP?PPU?LPI?之间的关系&#xff1f…

(三)React事件

1. React基础事件绑定 语法&#xff1a; on 事件名称 { 事件处理程序 }&#xff0c;整体上遵循驼峰命名法 App.js //项目根组件 //App -> index.js -> public/index.html(root)function App() {const handleClick () > {console.log(button被点击了)}return (<…

测试开发之自动化篇 —— 使用Selenium IDE录制脚本!

今天&#xff0c;我们开始介绍基于开源Selenium工具的Web网站自动化测试。 Selenium包含了3大组件&#xff0c;分别为&#xff1a;1. Selenium IDE 基于Chrome和Firefox扩展的集成开发环境&#xff0c;可以录制、回放和导出不同语言的测试脚本。 2. WebDriver 包括一组为不同…

ATTCK红队评估(五)

环境搭建 靶场拓扑图&#xff1a; 靶机下载地址: 漏洞详情 外网信息收集 确定目标靶机地址&#xff1a; 发现主机192.168.135.150主机是本次攻击的目标地址。探测靶机开放的端口信息&#xff1a; 目标靶机开放了两个端口&#xff1a;80、3306&#xff0c;那没什么意外的话就是…

企业如何运用信息化、智能化、数字化等技术手段规避企业合同风险?

在企业运营中&#xff0c;合同管理是至关重要的一环。它涉及到企业的各个方面&#xff0c;从供应链管理到客户关系&#xff0c;从财务交易到法律合规。然而&#xff0c;传统的合同管理方式往往存在效率低下、风险控制不足等问题。 随着信息化、智能化和数字化技术的发展&#…

go语言后端开发学习(一)——JWT的介绍以及基于JWT实现登录验证

什么是JWT JWT,全名为JSON Web Token&#xff0c;是当下主流的一种服务端通信认证方式&#xff0c;具有轻量,无状态的特点&#xff0c;它实现了让我们在用户与服务器之间传递安全可靠的Json文本信息&#xff0c;它的使用过程主要是这样的&#xff1a; 当用户注册的时候&#x…

Linux——nginx部署

部署Nginx 构建Nginx服务器 &#xff08;实验需要DNS支持&#xff0c;或添加hosts条目&#xff0c;例如&#xff1a; &#xff09; 安装Nginx&#xff08;yum安装即可&#xff09; 安装依赖软件包&#xff1a; 重启、启用服务并查看服务状态&#xff1a; 默认页面&#xff0…

【深度学习】深度学习之巅:在 CentOS 7 上打造完美Python 3.10 与 PyTorch 2.3.0 环境

【深度学习】深度学习之巅&#xff1a;在 CentOS 7 上打造完美Python 3.10 与 PyTorch 2.3.0 环境 大家好 我是寸铁&#x1f44a; 总结了一篇【深度学习】深度学习之巅&#xff1a;在 CentOS 7 上打造完美Python 3.10 与 PyTorch 2.3.0 环境✨ 喜欢的小伙伴可以点点关注 &#…

模糊控制器实现对某个对象追踪输入

MATLAB是一个十分便捷的软件&#xff0c;里面提供了许多集成的组件&#xff0c;本文利用simulink实现模糊控制器实现对某个对象追踪输入。 这里的对象根据自己的需求可以修改&#xff0c;那么搭建一个闭环控制系统并不是难事儿&#xff0c;主要是对于模糊控制器参数的设置&…

海思SD3403,SS928/926,hi3519dv500,hi3516dv500移植yolov7,yolov8(21)Yolov9s测试

四天前yolov9的作者终于开源了yolov9s和yolov9t模型。这个作者之前一直没开源t,s,只有c开始的,而且onnx转换后数据大小特别大,当时直接就放弃测试了。 另外之前代码有很明显的抄v5的痕迹。所以印象很不好。 现在总算是开源t,s模型,而且这里评估的结果上来看是好于yolov8的…

IDEA创建Mybatis项目

IDEA创建Mybatis项目 第一步&#xff1a;创建库表 -- 创建数据库 create database mybatis_db;-- 使用数据库 use mybatis_db;-- 创建user表 CREATE TABLE user (id INT AUTO_INCREMENT PRIMARY KEY,username VARCHAR(50) NOT NULL,password VARCHAR(50) NOT NULL,email VARC…

Django API开发实战:前后端分离、Restful风格与DRF序列化器详解

系列文章目录 Django入门全攻略&#xff1a;从零搭建你的第一个Web项目Django ORM入门指南&#xff1a;从概念到实践&#xff0c;掌握模型创建、迁移与视图操作Django ORM实战&#xff1a;模型字段与元选项配置&#xff0c;以及链式过滤与QF查询详解Django ORM深度游&#xff…

项目-五子棋双人对战:游戏房间的管理(5)

完整代码见: 邹锦辉个人所有代码: 测试仓库 - Gitee.com 之前我们已经实现了玩家匹配的功能, 我们都知道, 匹配完过后就可以进入游戏房间进行对战了, 所以我们下一步关注的重点就是对于游戏房间的管理. 模块详细讲解 功能需求 通过匹配的方式, 自动给玩家加入到一个游戏房间…

通过fiftyone按分类下载open-images-v7数据集,并转成yolov5可直接训练的格式

import osimport fiftyone as fo import fiftyone.zoo as foz import yamlclasses [Person, # 人 - 0Car, # 轿车 - 1Taxi, # 出租车 - 2Ambulance, # 救护车 - 3Bus, # 公共汽车 - 4Bicycle, # 自行车 - 5Motorcycle, # 摩托车 - 6Dog, # 狗 - 7Cat, # 猫 - 8M…

配置免密登录秘钥报错

移除秘钥&#xff0c;执行 ssh-keygen -R cdh2即可 参考&#xff1a;ECDSA主机密钥已更改,您已请求严格检查。 - 简书