云消息队列 Kafka 版 V3 系列荣获信通院“云原生技术创新标杆案例”

2024 年 12 月 24 日,由中国信息通信研究院(以下简称“中国信通院”)主办的“2025 中国信通院深度观察报告会:算力互联网分论坛”,在北京隆重召开。本次论坛以“算力互联网 新质生产力”为主题,全面展示中国信通院在算力互联网产业领域的研究、实践与业界共识,与产业先行者共同探索算力互联网产业未来发展的方向。

会议公布了“2024 年度云原生与应用现代化标杆案例”评选结果, “云消息队列 Kafka 版 V3 系列”荣获“云原生技术创新标杆案例”。

云消息队列 Kafka 版 V3 系列技术创新

云消息队列 Kafka 版 V3 系列基于阿里云强大的基础设施,对 Apache Kafka 进行了深度重构和优化,从而构建了端到端的竞争力。 其核心技术创新点包括:

  1. 利用先进的容器服务技术,显著提升了容器部署的密度和效率,大幅降低了运维成本。
  2. 依托于阿里云飞天盘古读写强一致的高性能分布式文件系统,实现了存算分离架构下 RTO(恢复时间目标)的理论最优值。
  3. 基于弹性 RDMA 网络,相较于传统的 TCP/IP 协议栈,结合 SMC-R 和 eRDMA,实现最高约 30% 的时延减少和最高约 5% 的 CPU 资源节省。
  4. 基于 AJDK 分代无暂停 GC 和 synchronized 兼容的协程,大幅度降低了长尾延迟。
  5. 基于 Alibaba Cloud Linux 3 操作系统中的 Page Cache(文件缓存)限制功能,解决了因 Page Cache无限制使用而导致的稳定性问题。

云消息队列 Kafka 版 V3 系列核心优势

经济 - 成本效益

云消息队列 Kafka 版在成本上具有显著的竞争优势,与 Apache Kafka 相比,其定价平均低约 30%,在某些特定场景下,成本降幅可达 80%。如此显著的经济效益,得益于云消息队列 Kafka 版在架构层面一系列的关键优化和创新。

  • 细粒度按量计费: 云消息队列 Kafka 版 Serverless 系列提供了细粒度的计费模式,支持完全按使用量付费,而不是以云服务器 ECS 实例的粒度进行计费。
  • 计算单副本架构: 云消息队列 Kafka 版基于高性能分布式文件系统提供的分布式强一致性读写语义,实现了 Kafka 计算层的一写多读能力,Leader 写入数据,Follower 强一致可读,计算层无需多副本复制就能实现系统高可用。减少 60% 的复制流量同时也降低 CPU 使用率,大幅提升计算节点利用率。
  • 存储智能分层架构: 闪存介质支持低延迟、高吞吐,微妙级 IO 延迟,磁盘介质支持低成本,温数据高性价比存储,OSS 支持海量数据长期归档存储。通过全链路 CRC 校验保证数据不丢不错,通过纠删码/多副本保证可靠性,通过软硬件协同优化发挥效能,持续释放技术红利。
  • 使用成本优化: 云消息队列 Kafka 团队有长时间研发和运维经历,积累了大量的实战经验。结合客户的业务模型,提供 Kafka 最佳实践,客户端和服务端都有 50% 的成本优化,避免不必要的开支。同时制定容灾方案以防止数据丢失或服务中断,帮忙客户用好、用深产品。

稳定 - 稳定可靠

云消息队列 Kafka 版的稳定性是其在数据流处理等场景中备受信赖的核心优势,这得益于其强大的架构设计和管理体系,为高效、安全的数据流处理提供了坚实的保障。

  • 高可用 HA: 存算分离架构下,计算层不再需要 ISR 这样重量级的副本复制协议,我们设计了一种轻量 HA 方案,优化了元数据管理机制、降低了系统复杂度。Follower Replica 仅作为计算资源的热备存在,只保有少量必要的元数据,仅需要处理少量的元数据变化请求,进一步提高计算层的处理效率。这种架构下,新节点能够快速接管数据并提供服务,为极致弹性打下扎实基础。
  • 多可用区容灾: 云消息队列 Kafka 版支持多可用区容灾体系,并达到了秒级 RTO(恢复时间目标)和零 RPO(恢复点目标)的高标准。即使发生整个可用区不可用级别的灾难性故障,系统也能在不丢失数据的情况下秒级恢复,确保数据的持续可用性和业务的连续性。
  • 自动化巡检: 云消息队列 Kafka 版的自动化巡检系统支持秒级巡检系统运行状态,及时发现异常情况。自动化运维手段减少了人为操作的错误概率,提高了系统的敏捷性和响应速度。
  • 报警机制: 云消息队列 Kafka 版具备完善的报警功能,涵盖多种潜在的故障类型和性能问题。无论是数据积压、节点故障,还是流量异常,报警系统都能迅速通知运维人员,使其能够及时采取措施,从而进一步增强了系统的稳健性和可靠性。

性能 - 高吞吐、低延时

云消息队列 Kafka 版基于阿里自研高性能分布式文件系统、高性能 RDMA 网络和操作系统等对 Apache Kafka 存储引擎进行深度重构,实现了高吞吐、低延迟的核心竞争力。

  • 高吞吐: 飞天盘古是阿里云自研的高性能分布式文件系统,解决了超大规模下数据不丢不错和高可用的难题,兼顾更加稳定可靠的存储能力、更大的容量和更高的性能等优点,广泛部署在全球数十个大型数据中心,服务阿里云上数百万的客户,覆盖互联网、政企、金融、制造等全行业。飞天盘古是阿里云关键的创新技术之一,满足数字经济对海量存储、快速存储和稳定存储的需求,并入选世界互联网领先科技成果。
  • 低延时: 存储低延时,用户态协议栈、闪存介质和高性能 RDMA 网络支持百微秒级平均延迟,毫秒级长尾延迟。计算低延时,针对平均延迟计算层无复制流量可以充分降低网络吞吐以避免拥塞,针对长尾延迟,使用主流编程语言领域最顶尖的内存管理技术,即新一代分代无暂停 GC(generational pauseless GC),大大降低了系统长尾延时。网络低延时,基于 SMC-R 技术(Alibaba Cloud Linux 3 提供的一套完全兼容 Socket API、基于 eRDMA 的共享内存实现的高性能内核网络协议栈),Kafka 无需代码改造即可享受到 eRDMA 技术带来的网络性能红利。相较于传统 TCP/IP 协议栈,云消息队列 Kafka 版使用 SMC-R + eRDMA,能带来最高约 30% 的时延减少和最高约 5% 的 CPU 资源节省。

弹性 - 灵活弹性

云消息队列 Kafka 版 Serverless 系列以其卓越的弹性能力,为企业提供了高效的资源管理和业务连续性保障。

  • 容器化部署: 阿里云容器服务通过硬件结构体系、操作系统、分布式调度配合,实现了面向 SLO 的资源精细化管理和弹性调度:VPA,弹性,超卖等调度技术,提升了资源弹性能力和资源的利用率。节点资源自动弹性结合调度能力提供了丰富的资源弹性能力:块资源弹性,resource limit 阈值弹性,定时弹性等。通过调度和节点弹性技术大幅度提升了容器部署密度和部署效率。
  • 自适应弹性: 云消息队列 Kafka 版 Serverless 系列在 20 MB/s - 1 GB/s 支持无感弹性;1 GB/s - 3 GB/s 支持秒级弹性;3 GB/s 以上支持分钟级弹性。客户可以依据业务流量的趋势,通过弹性能力极致地平衡成本与性能,从容且高效地应对突发流量高峰。
  • 秒级定时弹性: 对于超大规模集群,云消息队列 Kafka 版 Serverless 系列支持脉冲的定时弹性,允许预设弹性策略,在流量高峰期预留足够资源确保关键业务的持续性和稳定性,在低峰期则减少资源使用以节约成本,不仅提升了资源利用率,还降低了运维复杂度。

云消息队列 Kafka 版 V3 系列应用案例

云消息队列 Kafka 版已服务数万家企业,广泛应用于互联网、金融、汽车/出行、在线教育等 20 多个行业领域。以下是两个具有代表性的案例,展示了云消息队列 Kafka 版 V3 系列在实际业务中的应用价值。

曹操出行借助 ApsaraMQ for Kafka Serverless 提升效率,成本节省超 20%

曹操出行作为中国领先的共享出行平台,致力于将互联网、车联网、自动驾驶等先进技术应用于共享出行领域。随着业务规模的不断扩大,曹操出行面临以下挑战:业务流量波动明显,突增高流量对现有技术架构造成压力;数据来源广泛,并且这些数据需要被采集、缓存、分发给不同的数据系统进行处理。

为了应对上述挑战,曹操出行选择与阿里云合作,将 Kafka 迁移上阿里云,采用 ApsaraMQ for Kafka Serverless 系列,凭借其秒级弹性扩展和按需付费的优势,在实现灵活扩缩容的同时,保证了服务的敏捷性和稳定性,并节省了超过 20% 的成本。

更多详情请查看:

曹操出行借助 ApsaraMQ for Kafka Serverless 提升效率,成本节省超 20

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

道旅科技作为以科技驱动的全球酒店资源批发商,需要高效管理和深入分析海量旅游数据,以便更好地把握市场动态、满足客户需求、提升业务效率和优化用户体验。因此,道旅科技打造了先进的大数据平台,并选择 Kafka 作为数据流处理的核心组件,期望其能够提供实时数据处理、高并发高吞吐的消息传递、数据持久化和可靠性、高效管理成本和资源等关键价值。

云消息队列 Kafka 版凭借高吞吐与分布式架构,满足了道旅科技的实时数据收集、传输和高并发消息传递的需求。通过持久化能力与副本机制,进一步确保了数据可靠性和业务连续性。即使在高负载情况下也能稳定传递消息,防止数据丢失,维护数据完整性,从而保障旅游大数据平台的高效运行。 云消息队列 Kafka 版 Serverless 系列采用存算分离架构,并结合动态资源调整策略,能够根据实时业务负载自动进行弹性伸缩,实现按量付费,无需预先估算和配置实例规格。不仅降低了运维工作的复杂度,还显著降低了使用成本。

更多详情请查看:

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

欢迎点击此处了解关于云消息队列 Kafka 版产品的更多信息~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/957105.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024 年度学习总结

目录 1. 前言 2. csdn 对于我的意义 3. 写博客的初衷 3.1 现在的想法 4. 写博客的意义 5. 关于生活和博客创作 5.1 写博客较于纸质笔记的优势 6. 致 2025 1. 前言 不知不觉, 来到 csdn 已经快一年了, 在这一年中, 我通过 csdn 学习到了很多知识, 结识了很多的良师益友…

Spring Boot自动配置原理:如何实现零配置启动

引言 在现代软件开发中,Spring 框架已经成为 Java 开发领域不可或缺的一部分。而 Spring Boot 的出现,更是为 Spring 应用的开发带来了革命性的变化。Spring Boot 的核心优势之一就是它的“自动配置”能力,它极大地简化了 Spring 应用的配置…

1.2.神经网络基础

目录 1.2.神经网络基础 1.2.1.Logistic回归 1.2.2 梯度下降算法 1.2.3 导数 1.2.4 向量化编程 1.2.5 正向传播与反向传播 1.2.6.练习 1.2.神经网络基础 1.2.1.Logistic回归 1.2.1.1.Logistic回归 逻辑回归是一个主要用于二分分类类的算法。那么逻辑回归是给定一个x ,…

Matlab总提示内存不够用,明明小于电脑内存

目录 前言情况1(改matlab最大内存限制)情况2(重启电脑)情况3 前言 在使用matlab中,有时候需要占用的内存并没有超过电脑内存依旧会报错,提示内存不够用,可以尝试下面几种方法,总有一…

使用AI生成金融时间序列数据:解决股市场的数据稀缺问题并提升信噪比

“GENERATIVE MODELS FOR FINANCIAL TIME SERIES DATA: ENHANCING SIGNAL-TO-NOISE RATIO AND ADDRESSING DATA SCARCITY IN A-SHARE MARKET” 论文地址:https://arxiv.org/pdf/2501.00063 摘要 金融领域面临的数据稀缺与低信噪比问题,限制了深度学习在…

深入解析人工智能中的协同过滤算法及其在推荐系统中的应用与优化

目录 什么是协同过滤算法核心原理基本步骤相似度计算代码实现详解1.流程图2.创建基础的数据结构存储用户评分数据3.计算用户相似度4.获取相似用户5.推荐方法 算法优化建议1. 数据预处理优化去除异常值和噪声数据进行数据标准化使用稀疏矩阵优化存储 2. 相似度计算优化使用局部敏…

react install

react 安装 React 是一个用于构建用户界面的 JavaScript 库。以下是安装 React 的步骤: 使用 Create React App Create React App 是一个官方支持的命令行工具,用于快速搭建 React 应用。 安装 Node.js 和 npm 确保你的计算机上安装了 Node.js 和 npm…

程序员不可能不知道的常见锁策略

前面我们学习过线程不安全问题,我们通过给代码加锁来解决线程不安全问题,在生活中我们也知道有很多种类型的锁,同时在代码的世界当中,也对应着很多类型的锁,今天我们对锁一探究竟! 1. 常见的锁策略 注意: …

智启未来,AI筑梦科技新星”------华清远见成都中心2025冬令营圆满结束

2025年1月11日-16日,华清远见成都中心为期6天的“智启未来,AI筑梦科技新星”2025冬令营活动圆满结束。此次活动吸引了众多对人工智能和无人驾驶技术充满热情的学生参与,共同开启了一段点燃科技梦想的精彩旅程。 报道接待 以AI无人驾驶小车为核…

Debezium日常分享系列之:对于从Oracle数据库进行快照的性能优化

Debezium日常分享系列之:对于从Oracle数据库进行快照的性能优化 源数据库Kafka Connect监控测试结果 源数据库 Oracle 19c,本地,CDB数据库主机的I/O带宽为6 GB/s,由此主机上运行的所有数据库共享临时表空间由42个文件组成&#x…

RabbitMQ--延迟队列

(一)延迟队列 1.概念 延迟队列是一种特殊的队列,消息被发送后,消费者并不会立刻拿到消息,而是等待一段时间后,消费者才可以从这个队列中拿到消息进行消费 2.应用场景 延迟队列的应用场景很多,…

3DsMax设置中文界面

按键盘上的“Win”键,直接输入3dsmax,选择Simplified Chinese打开,之后就都是中文了

opencv在图片上添加中文汉字(c++以及python)

opencv在图片上添加中文汉字(c以及python)_c opencv绘制中文 知乎-CSDN博客 环境: ubuntu18.04 desktopopencv 3.4.15 opencv是不支持中文的。 这里C代码是采用替换原图的像素点来实现的,实现之前我们先了解一下汉字点阵字库。…

线程同步与Mutex

梦想是逃离世界… 文章目录 一、什么是线程同步?二、线程同步机制三、互斥锁(Mutex)四、loock 和 unlock五、Mutex的四种类型 一、什么是线程同步? 线程同步(Thread Synchronization)是多线程编程中的一个重要概念,它…

基于SpringBoot和PostGIS的全球首都信息管理设计与实现

目录 前言 一、首都空间表的设计 1、三张空间表的结构 二、SpringBoot后台管理的设计与实现 1、模型层的实现 2、业务层及控制层实现 三、前端的实现与成果可视化 1、新增数据的保存 2、首都的实际管理成果 3、全球首都信息 四、总结 前言 首都,一个国家的…

计算机网络 (50)两类密码体制

前言 计算机网络中的两类密码体制主要包括对称密钥密码体制(也称为私钥密码体制、对称密码体制)和公钥密码体制(也称为非对称密码体制、公开密钥加密技术)。 一、对称密钥密码体制 定义: 对称密钥密码体制是一种传…

【数据结构篇】顺序表 超详细

目录 一.顺序表的定义 1.顺序表的概念及结构 1.1线性表 2.顺序表的分类 2.1静态顺序表 2.2动态顺序表 二.动态顺序表的实现 1.准备工作和注意事项 2.顺序表的基本接口: 2.0 创建一个顺序表 2.1 顺序表的初始化 2.2 顺序表的销毁 2.3 顺序表的打印 3.顺序…

C 语言雏启:擘画代码乾坤,谛观编程奥宇之初瞰

大家好啊,我是小象٩(๑ω๑)۶ 我的博客:Xiao Xiangζั͡ޓއއ 很高兴见到大家,希望能够和大家一起交流学习,共同进步。* 这一课主要是让大家初步了解C语言,了解我们的开发环境,main函数,库…

根据 Web 服务器端的架构相关知识,将PHP改JAVA重构企业网站系统

目录 案例 【题目】 【问题 1】(7 分) 【问题 2】(8 分) 【问题 3】(10 分) 答案 【问题 1】解析 【问题 2】解析 【问题 3】解析 相关推荐 案例 阅读以下关于应用服务器的叙述,在答题纸上回答问题 1 至问题 3。 【题目】 某电子产品制造公司&#xff0c…

多选multiple下拉框el-select回显问题(只显示后端返回id)

首先保证v-model的值对应options数据源里面的id <el-form-item prop"subclass" label"分类" ><el-select v-model"formData.subclass" multiple placeholder"请选择" clearable :disabled"!!formData.id"><e…