高校多云资源统一管理和监控解决方案

项目背景与业务场景

随着云计算技术不断发展更新,高校科研用户对云服务需求不断提高,科研又是基础创新的来源,但算力少、共享难、不好用一直是科研的突出问题。小的科研团队经费少设备少,中型的科研团队设备有限,高峰期的算力不够,大型的科研团队算力富裕但是利用率比较低。所以对于算力的基础平台归一化,是能够帮助我们科研团队在底层的基础设施层面不再花费更多的精力。

为了解决上述困难, 我司研发了科研云云管理平台,将建设为面向学校领导、科研团队、信息中心、财务中心等用户的云计算资源统一管控入口,提供对高校基础云计算资源的全生命周期管理与运维。最终可实现高校内混合云基础设施的使用、运维和运营管理。同时让高校信息中心部门运维人员基本可以脱离或极小依赖原生云平台来实现多云管控的能力,极大提高运维、运营人员工作效率,有效降低混合云运维、运营难度。

高校科研主要面临的问题和痛点

1、资源零散管理

物理机器、科研设备、公有云、专有云、vmware 等等资源过于分散,缺乏有效的统一管理工具和高效的统筹机制,且资源分开采购成本较高。

2、资源申请不规范

资源申请流程过于繁琐,缺乏自动化的资源申请、分配工具。当申请人提交申请后,计算资源依靠人工手动分配,无法实现即租即用,整个过程耗时耗力。

3、资源回收困难

任务结束后,由于需要人工手动清理机器遗留数据,存在资源回收不及时、机器时常处于闲置状态的问题。

4、资源利用率低

跨学科跨地域协作难,算力分配不均,资源共享困难,导致资源利用率低,且缺乏统一的资源可观测性和计量计费,无法有效识别资源浪费和成本使用情况。

解决方案

科研云管理平台建设是结合高校的业务需求和资源特点的重要项目: 有别于传统的单一私有云管理系统,学院之间差异化地基于多公有云环境、自建私有云资源池,能够针对高校各学院资源使用模式,提供“资源共享、弹性扩展、动态运营、按需分配”的云计算资源统一调度、管控与服务能力。科研云管理平台建设完成后,可以实现 4 个方面的目标:

1、统一对接高校目前在用公有云和私有云,实现相关异构混合云计算资源的集中纳管,对云资源进行统一运营和运维,提升云计算资源的使用效率和管理效率。

2、作为统一对外触点为高校各学院提供异构混合云计算资源的服务调度支撑,实现统一平台的服务、流程和数据的打通。

3、构建统一科研云门户,可以面向不同学科打造不同的云服务特色资源包,降低使用门槛,能够让科研团队快速申请科研环境,提高科研效率。

4、整合学校各科研团队公共云资源使用,通过运营平台提升运营管理能力,清晰掌握校内资源需求情况;统一采购,月度统一结算,降低资源采购成本;简化科研团队采购公共云的流程等。

整体业务架构

科研云管平台在基础设施层提供公有云、私有云等混合云资源,在应用场景层提供自服务门户和运营管理平台,基于教师、科研人员、学生、管理者、财务人员等用户视角实现自服务门户的科研环境统一申请和管理,通过运营平台展示资源统计面板,自定义流程管理、统计分析、订/账单管理,实现资源的统一监控。同时可接入校内的消息中心,实现用户和管理者快速处理待办任务。

核心流程

1、科研团队使用算力服务

科研团队主要以科研空间管理,申请算力和使用算力这三个主要场景为主,另外还包含了账单和工单服务。

2、信息中心的运维管控

信息中心的运维管控主要是围绕日常的运维服务和资源管控等工作。

3、 财务中心/校领导的运营管控

财务中心和校领导主要负责科研经费的审核和支付,以及通过项目账单和资源消费情况进行运营分析。

主要场景

1、科研门户

建设高校统一科研云门户,展示各学科科研成果、科研公告、产品服务、科研项目介绍等,接入校园统一身份认证系统,支持校内外用户共同使用。

2、科研环境管理

面向不同学科打造不同的云服务特色资源包,方便科研团队自主根据资源、存储、算力去申请相关科研环境信息。

3、科研项目管理

支持项目立项、申请、团队组建全流程有效管理,以项目维度进行资源的申请、使用、结算及统计分析。

4、科研资源管理

所有云服务均通过统一服务门户提供,自服务门户实现云资源按需申请,在线审批,自动生成并分配,操作便捷。阿里云、华为云、Vmware、物理机等混合云 IT 的统一管理,实现云资源的无差别申请、使用、变配、释放等全生命周期管控。

5、科研费用管理

以项目维度按月统计资源消费情况,支持同步公有云账单和二次计费,以及专有云、虚拟化等产品的自主定价和计费出账。

6、科研看板管理

提供了围绕着科研场景及资源全流程的数据统计,混合云资源管控,更多面向资源和算力的统一监控和管理,降低维护成本,提高资源利用率。

7、资源统一监控

科研云云管理平台提供自定义场景视图、基础设施资源管理、监控告警、安全巡检等运维服务,方便云资源的管理者了解云资源的全貌,提供资源管理和优化的依据。

  • 自定义监控视图

用户可以根据不同的视角构建满足不同业务的「场景」,在场景的视图中支持添加 16 种图表类型用于数据报表展示,帮助用户直观地跟踪,分析和显示关键性能指标,使得能够监控整体的运行状况。

  • 告警事件

支持一站式查看和审计全部告警事件数据,可以对所有来源触发的事件进行实时监控、统一查询。还可以通过聚合相关事件和匹配关联事件,快速定位异常并高效对异常数据进行分析。

  • 基础设施管理

统一高效管控基础设施资源,主动绘制基础设施分布图,让复杂的基础架构以更简单的形式呈现,深入了解基础架构性能。

  • 监控管理

实现对各个云平台和云资源(包括虚拟机、GPU 主机、容器、服务器集群、存储空间、交换机、路由器、负载均衡器等)的资源运行状态、资源变更情况、资源配置情况、资源故障情况、资源统计分析报表、租户自身资源操作的监管。

  • 安全巡检

全方位安全巡检防护,定期对服务器、应用系统、网络设备、等资产进行安全检查,及时发现各类安全漏洞,提供详细描述和修复建议。

客户案例

客户简介

某大学是国家“211 工程”和“985 工程”重点建设的综合性大学,经过一百多年的建设与发展,已成为一所基础坚实、实力雄厚,在海内外有较大影响的研究型、综合型、创新型大学。

校内自运营 xx 云平台,以云服务的方式,为校内科研团队提供计算与存储能力支持。现有专有云多台机器,一些业务系统部署在其上。另外在 CAD 国家重点实验室拥有大资金投入的 GPU 超算集群,进行科学运算等。

CloudFlux 解决方案

1、基于 CloudFlux 构建统一云管平台,统一纳管校园私有云资源、并接入阿里公有云。

1)所有云服务均通过统一服务门户提供,实现云资源按需申请,在线审批,自动生成并分配,操作便捷。

2)自服务门户:用户能够在“我的订单”中对所有提交的订单进行查看,查看申请云资源的审批进度,是否已生产;需要审批的订单会自动流转到对应节点,审批人员在“我的审批”中对需要其审批的订单进行操作审批;当用户对云平台的使用有疑问时,可以向后台运营人员提交工单进行处理。

3)运营平台:运营人员能够对整个云平台的云资源商品进行自主定价;对用户进行账户创建,信息变更,余额充值等操作;能够根据业务需求,创建不同的审批流。

2、基于观测云搭建监测平台。

1)提供的云资源消费分析与优化监控,帮助用户分析在云资源上的成本支出结构,并根据负载状况及时提供优化建议。

2)提供可视化监控大屏。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/634015.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【企业动态】东胜物联成为AWS硬件合作伙伴,助力实现边缘智能

近日,AIoT硬件设备供应商东胜物联与全球领先的云计算服务提供商亚马逊云(AWS)达成合作关系,共同致力于推动物联网技术的发展,为企业客户提供更智能、灵活的硬件解决方案,助力智能化升级和数字化转型。 作为…

Vue3刷新页面后404,需要配置IIS的URL重写

Vue3刷新页面后404,需要配置IIS的URL重写 1.下载IIS重写工具 https://download.csdn.net/download/cplvfx/89331452 2.IIS的Url配置 安装后IIS会显示《URL重写》 选中你的站点 点击重写 点击《增加规则》 点击-空白规则 2.1匹配URL 请求的URL: 选择…

ArcGIS批量更改所有符号的格式

这期谈一下,如何修改所有符号的样式。 比如,我们需要更改下图的面符号位无轮廓的 该如何批量修改的呢? 视频教学吧: ArcGIS批量更改所有符号的格式 ArcGIS全系列实战视频教程——9个单一课程组合系列直播回放-CSDN博客文章浏览阅…

MavLinK协议

由于在公司需要使用这个,我就写一个文章用于入门级别 简单介绍 MAVSDK是PX4开源团队贡献的基于mavlink通信协议的用于无人机应用开发的SDK,其可以部署在Windows、Linux、Android等多种平台,并且支持多种语言如c/c、python、Java等。 在官网…

Docker-数据卷的挂载

文章目录 数据卷概念数据卷实现机制数据卷特性数据卷操作数据卷挂载通用命令匿名挂载具名挂载数据卷继承容器数据卷只读容器数据卷读写-默认 总结 数据卷概念 为了很好的实现数据保存和数据共享,Docker提出了Volume这个概念,简单的说就是绕过默认的联合文…

【手写大跟堆详解】

文章目录 大跟堆介绍大跟堆的结构大跟堆的应用场景大跟堆的代码实现 大跟堆介绍 大根堆(Max Heap)是一种特殊的二叉树结构,它满足以下两个条件: 1.完全二叉树:大根堆是一棵完全二叉树,即除了最后一层外&am…

ORACLE 资源管理参数与等待事件resmgr:cpu quantum

RESOURCE_MANAGER_PLAN 先来看下参数的含义 官网链接:RESOURCE_MANAGER_PLAN (oracle.com) 意思翻译过来这个参数用于资源计划。后边的看完也不是很明白具体的作用 于是参考了以下文章 Oracle 参数 RESOURCE_MANAGER_PLAN 官方解释,作用,…

Kubernetes——Pod详解

目录 一、Pod基础概念 1.概念 2.使用方式 3.Pause容器 3.1网络 3.2存储 4.Pod容器分类 4.1自主式Pod 4.2控制器管理的Pod 二、Pod的分类 1.基础容器(infrastructure container) 2.初始化容器(initcontainers) 2.1Ini…

前端vue用el-table如何实现表头内容过长换行处理,实现换行效果

前端vue用el-table如何实现表头内容过长换行处理,实现换行效果 这是效果图 有两种方法,一种简易版本,一种万能方法,都是el-table,先看文档 表头标题是可以自定义的 方法一 label的解释写在代码里面了,这里会自动形成换…

Edge浏览器“此页存在问题”解决思路

Edge浏览器显示“此页存在问题”解决思路 大家平时使用Edge浏览器时,是否和我一样会突然出现“此页存在问题”的情况? 经过百度查询后我找了一种情况和解决办法,能够大大减少这类问题的出现。出现“此页存在问题”可能是因为之前使用过软件…

C++相关概念和易错语法(13)(string的模拟实现)

string由于存在字符串和单字符的概念,使得它的一些接口,实现要比vector多一些。本质上来看string的实现是在顺序表的基础上加入串相关的操作。下面我会分享如何模拟实现string,这可以进一步提高我们对string的熟练程度。 1.构造函数、拷贝构…

Mysql与Navicat可视化命令大全 ----项目实战

软件准备:✍Mysql8.0下载地址(推荐)✍Navicat 16 下载地址(推荐) 注:不会安装看主页,关注我,免费指导,接计算机毕设☑ -----------------------------------------------…

交换机连接方式

一、级联方式 级联是将多个交换机或其他网络设备依次连接,形成一个层次结构,从而扩展网络的覆盖范围和端口数量。 在级联连接中,数据信号会从一个设备依次传递到下一个设备。每个设备都会接收并处理来自上级设备的数据,并将其转…

【MySQL精通之路】MySQL8.0新增功能-原子DDL语句支持

太长不看系列: 本文一句话总结,MySQL8.0支持多条DDL语句执行时的原子性了(仅限Innodb) 本文属于下面这篇博客的子博客: 【MySQL精通之路】MySQL8.0官方文档-新增功能 1.意义描述 MySQL 8.0支持原子数据定义语言&…

设置我们JavaScript设置的开发环境

你想设置一个用于编写Java脚本的开发环境,对吧?我们会在接下来的笔记中写一些JavaScript代码,所以我们需要一个开发环境。那么我们需要选择哪种开发环境呢? 通常情况下,对于像Java或C#这样的语言,你需要进行一些安装,对吧?你需要下载Java或某个运行时环境,并设置好路…

uniapp集成websocket不断线的处理-打牌记账

背景 近期在开发打牌记账微信小程序时,我们将房间这个业务场景做成了类似聊天室功能。 对房间内发生的动作,都能实时对其他人可见。 如:转账,离开,加入,结算等动作 其他人员都能实时接收到推送消息, 这个时…

Android模块化项目搭建和模块之间跳转传值(1)

一、背景 近段时间 由于工作没有这么繁忙,于是总结了一下项目中的模块化处理,并且这也是在众多面试中会问到的问题,希望能够帮助到在学习或者了解模块化的同学。 二、项目搭建 1、其实模块化就是将众多功能模块分成一个一个的模块进行开发…

<项目> 云备份

目录 一、简单认识 二、实现目标 三、服务端程序负责功能及功能模块划分 四、客户端程序负责功能及功能模块划分 五、环境搭建 (一)gcc 7.3 (二)安装jsoncpp库 (三)下载bundle数据压缩库 &#xf…

聊聊 JSON Web Token (JWT) 和 jwcrypto 的使用

哈喽大家好,我是咸鱼。 最近写的一个 Python 项目用到了 jwcrypto 这个库,这个库是专门用来处理 JWT 的,JWT 全称是 JSON Web Token ,JSON 格式的 Token。 今天就来简单入门一下 JWT。 官方介绍:https://jwt.io/intr…

添加、修改和删除列表元素

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 添加、修改和删除列表元素也称为更新列表。在实际开发时,经常需要对列表进行更新。下面我们介绍如何实现列表元素的添加、修改和删除。 …