当我们一起走过 2023|Apache Doris 年度时刻盘点

2024 年的第一个月已经彻底过去,2023 年的回顾总结才姗姗来迟。

在过去一年的大多数时间里,我们一直处于忙碌的状态中,紧锣密鼓的代码研发、高速推进的版本迭代、行程紧密的全国之行,众多社区用户与开发者皆是见证。

越是忙碌,在年末的这场回顾就越难能可贵。 在 2024 年开端,我们挑选出了一些有意义的片刻,期待跟每一个社区用户和开发者一同看看过去一年所共同经历的种种。正是因为每一个您都是见证者和参与者,所以把这场回顾的标题取为「当我们一起走过 2023」。

“里程碑式的跨越”

2023 年 8 月,我们迎来了具有里程碑意义的 2.0 版本发布,从此 Apache Doris 正式进入 2.0 时代。

Apache Doris 2.0.0 版本正式发布:盲测性能 10 倍提升,更统一多样的极速分析体验

11.png

如果用一个关键词来形容 Apache Doris 在过去的 2022 年所取得的种种收获,我们相信是“厚积而薄发后的全面进化”,而 2023 年 2.0 版本的发布则标志着我们实现了“里程碑式的跨越”:

  • 引入自适应的并行执行模型和全新查询优化器,盲测性能提升 10 倍,多表关联提升 13 倍,单表场景提升 10 倍、高并发点查询提升 20 倍;
  • 从报表和 Ad-hoc 等典型 OLAP 场景拓展到湖仓一体、高并发数据服务以及日志检索与分析,支撑更统一多样的分析场景;
  • 支持实时数据高吞吐写入、秒级时延,对各类数据更新都有完备的支持,构建更高效易用且稳定的实时数据处理和分析链路;

从贡献者和 Commits 数据可以看到,2.0.0 版本合入的 PR 超过 4100 个,比 1.2 版本增加了 70%、比去年同期发布的 1.1 版本更是增长了近 10 倍,参与这一版本开发的贡献者数量达 275 之多,在此再次向所有参与需求反馈、代码研发、功能测试以及版本验证的贡献者表示最衷心的感谢。

22.png

“10000 Star 新成就达成”

2023 年 11 月,我们在 GitHub 上首次突破 10000 Star,相较于去年同期 增长超过 70%。

过去一年多的时间里,Apache Doris 保持着极为稳定和高速的 GitHub Star 增长、多次登顶 GitHub Trending 榜单,收到全球开发者的关注。

33.png

“600”、“4000”

2023 年 12 月,Apache Doris 内核贡献者达到 600 位。与 2021 年相比,内核贡献者规模这一数字已经连续两年增长超过 100%,几乎每一周都会有许多新面孔开始参与社区贡献。

44.jpeg

他们中的许多也因为对社区的突出贡献,成为新晋 PMC 和 Committer 中的一员。

55.jpeg

从社区开发者活跃度指标来看:

  • 在过去十个月,Apache Doris 社区平均每月活跃贡献者稳定在 120 人左右,已大幅超过全球知名的开源大数据项目,包括 Spark、Elasticsearch、Trino、Druid 等;
  • 这些贡献者们每周都会为 Apache Doris 贡献超过 160 个PR,同时社区也建立了更加成熟稳定的 CR 流水线,每个合入的代码都会经过 3000+ 的测试用例,这也使得社区以极快速度迭代的同时,稳定性也得以保证;

这一系列数字无不说明,Apache Doris 现在已经成为全球最活跃的开源大数据项目之一

66.png

在技术加速迭代的同时,我们也看到有越来越多的用户开始选择相信 Apache Doris。到 2023 年底,社区交流群已经聚集了超过 36000 名数据库以及大数据相关领域的工程师。

在过去许多社区用户的印象中,Apache Doris 更多是被互联网企业所使用,例如百度、美团、小米、京东、腾讯等互联网一线企业。而现如今所覆盖的行业领域已越来越广泛,不论是金融、政企、电信、制造亦或是交通、物流、快速消费品行业等,都有着许多企业在其核心分析业务中应用 Apache Doris。因此在今年 Summit 上,我们正式公布了 Apache Doris 在全球范围的用户规模,**已有超过 4000 家企业在生产环境使用 Apache Doris,享受由 Apache Doris 带来的极致分析体验,并且这一数字仍在快速增长中!**这 4000 多家企业用户中,绝大多数都与我们有着直接的接触,不论是反馈需求、参与测试、提交代码或是分享实践经验,都在以他们的方式回馈和贡献社区。

所以我们有理由相信,在如此庞大的用户规模下,Apache Doris 已成为各行各业用户在使用实时数据仓库的首选,成为开源实时数据仓库领域的事实标准!

77.png

我们也诚邀更多小伙伴们在 Apache Doris 官网留下属于自己的印迹,分享遇见 Apache Doris 的故事。

“与创新者同行”

2023 年 10 月,Apache Doris 首届线下技术峰会在北京落下帷幕。

大约在 8 月初,距离峰会开幕还有十余周的时间,彼时峰会的筹备工作已经全面启动,但有一个问题始终横在我们面前,就是我们该选择什么样的峰会主题。

这个问题说简单也简单,说难也难。最简单的就是虚无缥缈的词汇堆积,毕竟结束一段时间以后,除了举办过峰会这件事情本身,能让人留下的记忆实在有限。难的地方在于,我们是真的很想把过去一段时期的进展与收获、理念与愿景,通过简单的几个字呈现出来——越是高度凝练的表达、越难以被提炼出来。

所以在回顾完 Apache Doris 从诞生至今的完整历程,我们想到,这不就是一个讲述技术创新的故事么?——于是有了**“与创新者同行”**这个主题。

1.png
2.jpeg
3.jpeg
4.jpeg

这里再分享一个幕后小故事。

在峰会主论坛演讲中的间隙,兼任峰会主持人的明雨坐在第一排的主席台上发了一条朋友圈。第一张照片是 Doris 已开源但还未进入 Apache 基金会时举办的第一场 Meetup,彼时还未更名 Doris 也没有任何知名度,现场观众寥寥无几,甚至比工作人员还少。第二张是 Summit 现场座无虚席的照片,到场近千人、连最后一排的过道都站满了观众。

88.jpeg

所以我们需要向所有参与峰会分享的嘉宾致敬,也更需要向每一位社区用户、开发者和开源爱好者致敬。正是这一位位追风赶月的创新者们,让我们可以一起奋进,也期待未来与更多创新者与一同前行,探索数据世界的更多可能性。

“大型网友见面会”

2023 年 4 月,我们开启了全国的城市行活动,各个城市 User Group 累计突破了 1000 人。

这一年里,Apache Doris 的足迹遍布了北京、上海、西安、杭州、深圳、成都、武汉、广州等近十个城市,与数千开源用户面对面交流、倾听来自用户最真实的声音,也让更多人感受到 Apache Doris 社区自由、纯粹的技术氛围。

拼图8.jpeg

2024,保持专注、迈向新的不凡

保持专注是一件很困难的事情,越是在充斥着不确定性的外部环境中,越是难以保持专注。

我很庆幸的是,对于如何做好开源社区、对于如何服务好用户、对于需求的思考和迭代、对于未来演进趋势与愿景,过去几年 Apache Doris 社区一直在保持着专注。

而对于未来,我们也将保持开源初心,更加坚定地在开源道路上前行,相信终将迈向新的不凡。

新年活动

2024 年 Apache Doris 社区 RoadMap 已经在 GitHub 上发布,欢迎所有社区小伙伴们参与讨论。我们将从参与讨论的小伙伴中挑选出 5 位送出新年社区周边盲盒,期待听见您的声音。https://github.com/apache/doris/issues/30669

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/376605.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Yearning审核平台本地安装配置并结合内网穿透实现远程访问

文章目录 前言1. Linux 部署Yearning2. 本地访问Yearning3. Linux 安装cpolar4. 配置Yearning公网访问地址5. 公网远程访问Yearning管理界面6. 固定Yearning公网地址 前言 Yearning 简单, 高效的MYSQL 审计平台 一款MYSQL SQL语句/查询审计工具,为DBA与开发人员使用…

vector类的模拟实现

实现基本的vector框架 参考的是STL的一些源码&#xff0c;实现的vector也是看起来像是一个简略版的&#xff0c;但是看完能对vector这个类一些接口函数更好的认识。 我们写写成员变量&#xff0c;先来看看STL的成元变量是那些 namespace tjl {template<class T>class …

【C语言|数据结构】数据结构顺序表

目录 一、数据结构 1.1概念 1.2总结 1.3为什么需要数据结构&#xff1f; 二、顺序表 1.顺序表的概念及结构 1.1线性表 2.顺序表分类 2.1顺序表和数组的区别 2.2顺序表的分类 2.2.1静态顺序表 2.2.1.1概念 2.2.1.2缺陷 2.2.2动态顺序表 三、动态顺序表的实现 3.1新…

Pandas文本数据处理技术指南—从查找到时间序列分析【第66篇—python:文本数据处理】

文章目录 Pandas文本数据处理技术指南引言 1. 查找文本数据2. 替换文本数据3. 拼接文本数据4. 正则表达式操作5. 虚拟变量6. 处理缺失值7. 分割文本数据8. 字符串处理方法9. 文本数据的合并与连接10. 文本数据的排序11. 文本数据的统计分析12. 文本数据的分组与聚合13. 文本数据…

使用Softing edgeConnector模块将云轻松连接到Siemens PLC

一 工业边缘的连接解决方案 云服务提供商 (CSP) 引入了服务和功能&#xff0c;以简化基于云的工业物联网解决方案的实施。Azure Industrial IoT Platform或AWS IoT SiteWise支持标准协议和接口&#xff0c;例如OPC UA或MQTT。但是&#xff0c;如果您希望在典型的旧改项目中连接…

【代理模式】

定义&#xff1a;代理模式是一种结构型设计模式&#xff0c;它允许我们创建一个代理对象&#xff0c;用于控制对另一个对象的访问。 代理对象充当了被代理对象&#xff08;目标对象&#xff09;的代表&#xff0c;与被代理对象实现相同的接口&#xff0c;从而实现对被代理对象…

【PowerShell】修改Windows网络配置的常用命令

PowerShell&#xff08;PS&#xff09;是一种强大的任务自动化和管理框架&#xff0c;具有丰富的命令和语法&#xff0c;可以用于编写脚本来管理Windows操作系统和其他应用程序。它的开放式架构和跨平台支持使得它成为一个灵活和可扩展的工具。 在网络配置方面&#xff0c;Powe…

C++ 日期计算器

日期计算器 概要 Date类的规划Date类的实现Date 构造函数Date 拷贝构造函数~Date 析构函数GetMonthDay 求某年某月的天数operator 赋值操作符重载operator 加等操作符重载operator 加号操作符重载operator- 减等操作符重载operator- 减法操作符重载 &#xff08;日期 - 天数&am…

分享66个行业PPT,总有一款适合您

分享66个行业PPT&#xff0c;总有一款适合您 66个行业PPT下载链接&#xff1a;https://pan.baidu.com/s/1kcUOfR_xtH9CAJC12prcTw?pwd8888 提取码&#xff1a;8888 Python采集代码下载链接&#xff1a;采集代码.zip - 蓝奏云 学习知识费力气&#xff0c;收集整理更不易。知…

算法学习——华为机考题库3(HJ21 - HJ25)

算法学习——华为机考题库3&#xff08;HJ21 - HJ30&#xff09; HJ21 简单密码 描述 现在有一种密码变换算法。 九键手机键盘上的数字与字母的对应&#xff1a; 1–1&#xff0c; abc–2, def–3, ghi–4, jkl–5, mno–6, pqrs–7, tuv–8 wxyz–9, 0–0&#xff0c;把密码…

Swift Combine 发布者订阅者操作者 从入门到精通二

Combine 系列 Swift Combine 从入门到精通一 1. Combine核心概念 你只需要了解几个核心概念&#xff0c;就能使用好 Combine&#xff0c;但理解它们非常重要。 这些概念中的每一个都通过通用协议反映在框架中&#xff0c;以将概念转化为预期的功能。 这些核心概念是&#x…

Cocos creator 3.x 刚体组件碰撞无效

Cocos creator 3.x 刚体组件碰撞无效 问题描述&#xff1a;只有一个circleCollider2D时&#xff0c;可以在碰撞时正确输出结果&#xff0c;但是当我在外围加了一个circle之后&#xff0c;期望character进入圆圈范围时就触发方法&#xff0c;此时原代码失效 import { _decorat…

简单说网络:TCP+UDP

TCP和UPD: (1)都工作在传输层 (2)目的都是在程序之中传输数据 (3)数据可以是文本、视频或者图片(对TCP和UDP来说都是一堆二进制数没有太大区别) 一、区别:一个基于连接一个基于非连接 将人与人之间的通信比喻为进程和进程之前的通信:基本上有两种方式(1)写信;(2)打电话;这…

【51单片机】实现一个动静态数码管显示项目(前置知识铺垫,代码&图演示)(5)

前言 大家好吖&#xff0c;欢迎来到 YY 滴单片机 系列 &#xff0c;热烈欢迎&#xff01; 本章主要内容面向接触过单片机的老铁 主要内容含&#xff1a; 欢迎订阅 YY滴C专栏&#xff01;更多干货持续更新&#xff01;以下是传送门&#xff01; YY的《C》专栏YY的《C11》专栏YY…

Redis的数据类型Hash使用场景实战

Redis的数据类型Hash使用场景 常见面试题&#xff1a;redis在你们项目中是怎么用的&#xff0c;除了String数据类型还使用什么数据类型&#xff1f; 怎么保证缓存和数据一致性等问题… Hash模型使用场景 知识回顾&#xff1a; redisTemplate.opsForHash() 方法是 Redis 的 …

QAnything之BCEmbedding技术路线

QAnything和BCEmbedding简介 QAnything[github]是网易有道开源的检索增强生成式应用&#xff08;RAG&#xff09;项目&#xff0c;在有道许多商业产品实践中已经积累丰富的经验&#xff0c;比如有道速读和有道翻译。QAnything是一个支持任意格式文件或数据库的本地知识库问答系…

python的数据类型

&#x1f388;srting&#xff08;字符串&#xff09;&#xff1a; 操作符&#xff1a; &#xff1a;字符串连接 aabc befg print(ab) #输出 abcdefg * : 重复输出字符串 aabc print(a*3) #输出 abcabcabc [ : ]:截取字符串中的一部分&#xff0c;遵循左闭右开的原则&am…

vue实现购物车案例

话不多说&#xff0c;先上效果图。 安装elementui组件库&#xff0c;可直接食用。 <template><div><!-- 购物车部分 --><el-container><el-header><h1>购物车案例一条龙</h1></el-header><el-main><!-- 折叠面板…

springboot Feign方式注入注解详解

一、FeignClient注解详解 FeignClient是Spring Cloud中用于声明Feign客户端的注解&#xff0c;它使得编写HTTP客户端变得更简单。通过Feign的自动化配置机制&#xff0c;可以很容易地编写HTTP API客户端。以下是FeignClient的详解&#xff1a; 作用&#xff1a;FeignClient注解…