开箱即用的使用体验!Alibaba Cloud Linux 的演进之旅

随着云计算的发展,越来越多的云上用户对操作系统提出了新的诉求。在 2023 龙蜥操作系统大会阿里云分论坛上,阿里云操作系统团队贾正华分享了 Alibaba Cloud Linux(以下简称“Alinux”)的发展历程及未来展望,介绍了 Alinux 通过在稳定性、安全、性能、服务支持上持续建设,为用户提供更好的云上操作系统体验,发展成为阿里云上部署规模最大的操作系统。同时面向未来 AI 智算场景,Alinux 希望通过提供开箱即用的 AI 容器镜像,为用户的 AI 应用场景,提供一个易用性、稳定性、安全性、性能都更好的运行环境。以下为分享原文:

图片

阿里云从 2009 年开始进行操作系统的研发。早期,操作系统主要是服务集团内部,如淘宝、支付宝等业务上。但是随着云计算的发展,越来越多的云上用户对操作系统提出了新诉求,因此在 2017 年,阿里云把操作系统开源、开放到了云上,用来服务云上用户。

图片

2020 年,伴随着龙蜥社区的成立,Alinux 在龙蜥技术的加持下,目前已部署在云上 400 万实例中,服务了云上 40 万用户。在 2023 年初超越 CentOS,发展成为阿里云上部署规模最大的操作系统

图片

Alinux 从建立之初,就以提升用户云上的操作系统体验为立身之本,持续提供超长的生命周期维护、确定性的长远规划,以保证用户使用操作系统的连续性;提供云上的商业级安全的保障能力、云上安全的各种加固的解决方案,更好地满足用户丰富多样的安全诉求。Alinux 所有的技术都会在阿里云的各个技术产品等进行大规模的实践打磨,以此保证用户使用操作系统的业务稳定性。同时还提供云上的各种各样的软硬协同的方案,不管是南向的硬件协同,还是北向软件协同,都是为了让用户,在现有的基础设施的基础之上,能够通过软件释放云上算力,进一步提升应用的体验。

图片

最近几年,相信大家饱受 CentOS 停服的困扰,很多使用 CentOS 的用户都在寻找新的操作系统来替代。而对于阿里云很多使用 Alinux 的用户来说,他们所受的影响相对比较小,因为 Alinux 兼容 CentOS 生态和运维方式且保持十年的生命周期的维护,不管是哪一代操作系统。目前 Alinux 主力在第三代操作系统(Alinux 3)上,它的生命周期将会延续到 2031 年。在不久的将来也会发布下一代的操作系统——Alinux 4,下一代操作系统仍然会保持 10 年的生命周期维护。

图片

在开源软件的生态支持上,阿里云的全场景中,不论是 ECS、裸金属还是容器等,都会通过“自研+开源”的技术支持云上广泛的应用生态。不管是用户对于虚拟化技术、容器技术,还是使用各种工具链、语言运行时,还是在上层的数据库应用、AI 应用都可以在 Alinux 上轻松自如的部署。同时伴随着自研能力的加持,操作系统的内核,Dragonwell 的工具链,可以帮助用户在现有的能力之上进一步提升应用的体验,无论是性能、稳定性还是安全能力。

图片

上文提到了 Alinux 的安全保障,我们通过建立标准化的安全治理平台,在漏洞的感知、评估、修复、披露等全流程的安全漏洞的治理环节,通过与各种各样的 ISV、OSV、行业的伙伴形成了更多的安全治理方法。同时在安全生态上共建,通过漏洞感知场景上的漏洞挖掘、监听,在漏洞评估环节进行的各种评分定级,在漏洞的修复环节进行全量的有质量的测试验证,最后将这些安全的漏洞信息和修复方案发布到安全的中心。大家可以登录 Alinux 的安全中心(https://help.aliyun.com/zh/alinux/product-overview/security-bulletin),查看各种各样的安全漏洞信息和修复方案。

图片

关于 Alinux 稳定性。以多个活跃上游社区为上游的 base,将它引入到龙蜥社区,与龙蜥的生态合作伙伴一起共建。同时基于我们完善的发行版的保障体系确认发行版的发行质量,在发行版构建完成后,我们会将发行版的镜像在阿里的云产品上进行大规模实践打磨。特别强调一下,所有用户在阿里云上选择使用的 Alinux 和其他云产品上使用的操作系统完全一样,都会经过阿里海量的应用打磨,包括双 11 及其他各种各样的大促活动,这也很大程度上保障了操作系统基础的稳定性。阿里云操作系统团队是非常专业的团队,会为整个操作系统从创建到测试,再到安全,最后到发布,为操作系统的生命周期提供全量的安全保障和兜底的能力支持。

图片

在性能方面。我们的性能分成南向硬件的协同能力和北向软件的系统优化能力。先介绍硬件的协同能力。大量各种各样的硬件 CPU、GPU 等能力,提供了很多新的指令集或者加速库。Alinux 在内核侧会优先完成加速库或者指令集的使能支持,例如在新一代八代实例英特尔的 SPR 实例上提供了AMX AI 的矩阵计算能力、QAT 加解密计算能力。我们通过在内核测使能,同时结合应用侧的应用库,如 OneDNN 应用库,可以让用户在各种各样的应用场景无缝使用这些硬件的加速能力,通过软硬协同的能力提升用户的应用体验。

图片

北向软件本身的生态非常复杂,它的应用也非常宽泛,因此我们在阿里云上提供了应用优化产品——KeenTune(轻豚),KeenTune 可以通过智能的参数调优,专家知识库的积累,帮助应用完成最适应应用场景的性能优化手段,让用户现有的应用无需做任何改造,就可以完成应用优化。

伴随着 AI 计算时代的到来,很多用户对于 AI 技术的能力有了更多的诉求,这些诉求对于操作系统也提出了大量新的挑战和要求。从  AI 工程化方面来说,整个南向的 AI 相关的硬件非常多,涉及到 CPU、GPU、MPU、XPU 等各种各样的硬件,这些硬件同时伴随着大量的驱动、版本,会导致用户对于这部分有大量的南向硬件兼容性的诉求,但得不到满足。北向生态上的应用场景也非常丰富,有各种各样的语库,这导致用户在使用各种各样的应用软件时,有大量的适配成本。同时整个 AI 的软件栈本身的复杂度也非常高。

图片

面对以上用户的诉求,Alinux 提出了自己的解法,希望能为用户提供 AI 的优化镜像,可以满足用户开箱即用的诉求:

图片

  • 通过更新的软件版本选型,让用户体验到新组件当中的特性红利。

  • 通过阿里云和英特尔、AMD、英伟达、海光等硬件基础设施厂商的合作,联合推出解决方案。

  • 通过软硬件生态布局,为用户提供整个全软硬件的自由组合。

最后将以上能力都全部固化到镜像侧,让用户可以通过镜像获取,即可完成整个 AI 的基础环境的最好体验。

图片

上述方法涉及到整个的 AI 镜像发布,因此 Alinux 打造了全链路的镜像发布平台,镜像平台可以为用户提供最佳的镜像构建的能力。在平台中通过统一镜像集成的框架、制作的调度系统、用户界面、多样化的镜像的仓库,全流程的保障整个镜像的发布流程。从镜像的构建到镜像的测试,到安全扫描的卡点,最后到镜像发布,在整个全流程上可以保证对于镜像的稳定性、兼容性、安全性,还有基础性能。

图片

为了方便用户更好获取镜像产品,已发布新一代 Alinux 的产品形态——Alibaba Cloud AI Containers,(简称AC2)。大家只需登录Alibaba Cloud Linux 官网(https://help.aliyun.com/zh/alinux/getting-started/ac2-container-image-list)即可查看、获取,使用镜像,也可以通过官网寻求支持和合作。

欢迎大家扫码加入龙蜥(钉钉群号:78885006080)、Alinux 交流群(钉钉群号:23149462),一起探讨操作系统前沿技术。

—— 完 ——

关于龙蜥

龙蜥社区是立足云计算打造面向国际的 Linux  服务器操作系统开源根社区及创新平台。龙蜥操作系统(Anolis OS)是龙蜥社区推出的 Linux 发行版,拥有三大核心能力:提效降本、更加稳定、更加安全。

目前,Anolis OS 23 已发布,全面支持智能计算,兼容主流 AI 框架,支持一键安装 nvidia GPU 驱动、CUDA 库等,完善适配 Intel、兆芯、鲲鹏、龙芯等芯片,并提供全栈国密支持。

加入我们,一起打造面向云时代的操作系统!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/582470.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

unittest_parameterized批量测试测试用例

import unittest from parameterized import parameterizeddef add(x, y):return xy"""问题:如果有三组数据需要测试?[(1,1,2), (1,2,3), (0,3,3)] """def get_data():return [(1, 2, 3), (3, 0, 3), (2, 1, 3)]# 定义测试…

第3篇:创建Nios II工程之Hello_World<二>

Q:上一期介绍完基本设计流程和实验原理,接着我们完成系统硬件设计部分,包括Platform Designer系统及Quartus工程。 A:依次搜索并添加Nios II Processor、JTAG UART、On-Chip Memory和System ID IP组件,连接各组件并As…

C#窗体控件ColorDialog

介绍 可以获取颜色,然后对其他控件的颜色属性进行设置。 构造方式 直接把ColorDialog控件拖动到Form窗口。 常用属性 AllowFullOpen 可以控制是否使用自定义颜色,true表示可使用,否,表示不可使用。 AnyColor 如果为tr…

Leetcode—682. 棒球比赛【简单】(stoi函数、accumulate函数)

2024每日刷题&#xff08;120&#xff09; Leetcode—682. 棒球比赛 实现代码 class Solution { public:int calPoints(vector<string>& operations) {vector<int> v;for(const string& oper: operations) {if(oper "") {v.push_back(v.back(…

渗透新思路 | 仿真环境下内存转储分析和模糊测试的全记录

本文由安全研究人员hugsy于2024年03月26日更新并发表于blahcat博客上&#xff0c;本文主要记录了其在进行内存安全和模糊测试任务时发现的一些技术实现方式&#xff0c;主要讨论的是仿真环境下内存转储分析和模糊测试方法。本文旨在为红队和蓝队研究人员提供新的思路&#xff0…

数字化技术可以促进中国企业创新吗?

数字化技术可以显著促进中国企业的创新。数字化技术&#xff0c;包括人工智能&#xff08;AI&#xff09;、区块链&#xff08;Blockchain&#xff09;、云计算&#xff08;Cloud computing&#xff09;、大数据&#xff08;big Data&#xff09;等&#xff0c;被称为ABCD技术&…

TruLens

文章目录 一、关于 TruLensHow it works 二、安装三、快速使用Get DataInCreate Vector StoreBuild RAG from scratchSet up feedback functions.Construct the appRun the app 一、关于 TruLens Evaluate and Track LLM Applications 官网&#xff1a;https://www.trulens.o…

【Redis 开发】详细搭建Redis主从,并了解数据同步原理

Redis主从搭建 Redis主从搭建Redis的主从架构数据全同步原理数据的增量同步优化Redis主从集群 Redis主从 搭建Redis的主从架构 主从节点可以实现读写分离&#xff0c;将都大量的读操作分担与诸多从节点当中去 从节点可以叫做slave或者replica 如何搭建&#xff1a; 在一台…

node 项目启动报 ERROR Failed to compile with 1 errors 错误

问题 node项目通过npm run dev启动时出现ERROR Failed to compile with 1 errors 错误&#xff0c;具体信息如下&#xff1a; ✖ WebpackCompiled with some errors in 366.81msERROR Failed to compile with 1 errors …

如何买到“30元以下”的免备案服务器?

对于预算有限的个人和小型企业来说&#xff0c;30 元以下免备案服务器的价格非常亲民。用户可以以极低的成本获得所需的服务器资源&#xff0c;这对创业者、个人开发者、学生和站长来说简直不要太划算&#xff0c;毕竟配置可以升级真不够后面再付费升级也行。 何为“免备案”&…

xLua背包实践

准备工作 环境&#xff0c;代码 在C#代码方面我们需要准备单例模式基类&#xff0c;AB包管理器&#xff0c;lua解析器管理器 详情请见AB包管理器 xlua详解 然后是Xlua包和AB包&#xff0c;具体导入方法也在上面的链接中 然后是lua的三个文件 具体代码&#xff1a; JsonUtil…

主观赋权法、客观赋权法、组合赋权法、评价指标体系构建

在科研领域&#xff0c;为了对某个研究主题进行深入的探讨和评估&#xff0c;我们往往需要构建一套科学合理的评价体系&#xff0c;并为其中的各项评价指标赋予相应的权重。比如&#xff0c;在评价一项新技术的性能时&#xff0c;我们可能会考虑其创新性、实用性、成本效益等多…

git的学习笔记

git的学习使用 参考了书和好多网上搜到的连接&#xff0c;忘了记录参考的了&#xff0c;太多了&#xff08;&#xff09;捋出来一个大致的较为全面的git个人使用流程。 &#xff08;一&#xff09;基本操作&#xff1a; 安装配置好git 创建目录 init 初始化一个仓库&#xff0…

Golang | Leetcode Golang题解之第55题跳跃游戏

题目&#xff1a; 题解&#xff1a; // 贪心算法 func canJump(nums []int) bool {cover : 0n : len(nums)-1for i : 0; i < cover; i { // 每次与覆盖值比较cover max(inums[i], cover) //每走一步都将 cover 更新为最大值if cover > n {return true}}return false } …

2024通信会|迈向智慧配电网建设新时代,锐捷网络发布双平面配电通信解决方案

近期,以“加快推进通信数智化,助力构建新型能源体系”为主题的2024年能源网络通信创新应用大会在四川成都圆满结束,会议围绕构建新型能源体系和新型电力系统建设需求,探讨能源网络通信创新应用的最新趋势与成果、“主、配、微”通信网一体化融合、配电通信网、通信数智化转型等…

41-数组 _ 数组作为函数参数

41-1 冒泡排序函数的设计 数组传参的时候&#xff0c;形参有2种写法&#xff1a; 1、数组 2、指针 往往我们在写代码的时候&#xff0c;会将数组作为参数传个函数 如&#xff1a;实现一个冒泡排序&#xff0c;将数组的数据排成升序 冒泡排序的核心思想&#xff1a; 1、两…

NGINX发布动态页面的方法

一、建立 [rootserver100 html]# vim index.php [rootserver100 html]# pwd /usr/share/nginx/html 二、下载PHP文件 [rootserver100 conf.d]# dnf install php.x86_64 -y 正在更新 Subscription Management 软件仓库。 无法读取客户身份 本系统尚未在权利服务器中注册。可…

国内十大CRM软件盘点2024:专家推荐+用户真实反馈

Zoho CRM软件即客户关系管理系统&#xff0c;这个概念自1999年由GartnerGroup公司提出以来逐渐演变&#xff0c;最初是为了填补ERP系统在客户关系管理方面的缺失&#xff0c;后来发展成了企业战略中不可或缺的工具。随着企业对客户管理的重视程度不断提升&#xff0c;越来越多的…

Socket套接字(UDP数据报)篇

Socket 概念数据报套接字DatagramSocketDatagramPacketInetSocketAddress 小结 概念 Socket套接字,是由系统提供用于网络通信的技术,是基于TCP/IP协议的网络通信的基本操作单元. 基于Socket套接字的网络程序开发就是网络编程. 数据报套接字 使用的是UDP(User Datagram Protocol…

IGM焊接机器人RTE 495伺服电机维修详情一览

在当今科技迅速发展的时代&#xff0c;机器人已成为各行各业不可或缺的重要工具。IGM机器人便是其中之一&#xff0c;其工业机械手伺服马达作为机器人的关键部件&#xff0c;确保机器人能够高效、稳定地运行。当出现IGM焊接机器人RTE 495伺服电机故障问题时&#xff0c;及时进行…