开源之夏是由中国科学院软件研究所与 OpenEuler 社区共同主办的一项面向高校学生的暑期在线活动,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展。
在开源之夏 2023 年中,MatrixOne 一共有 2 个任务项目,最终全部顺利结项,并在开源之夏结业项目中进行展示:开源软件供应链点亮计划-开源之夏2023 [Link: https://summer-ospp.ac.cn/final]
项目01 数据库机器学习及 AI 的 Python 嵌入
将 Python 嵌入到 MatrixOne 数据库中,使 Python 能够与数据库执行引擎通信,从而实现在数据库中使用ML/AI。Python 将在容器/沙箱中运行,以实现安全性和资源管理。
完成人:刘明熹
对应PR:https://github.com/matrixorigin/matrixone/pull/11098
导师点评:
刘明熹按照项目规划完成了 Python 的 UDF 框架实现,支持了向量化 API 和 Kubernetes 上的 Python UDF server 部署方案。同时,在项目过程中,刘明熹还帮助改进了 MO 的 UDF 代码结构,修复了一些 bug。最后,刘明熹还额外写了一篇文档,详细描述 MO Python UDF 的用法并提供了一个信用卡欺诈检测的实战案例。在项目之外,刘明熹一直积极与导师和其他 MO 的开发者沟通探讨,保障了项目顺利实施。总的来说,刘明熹不仅完成了项目的所有预期目标,在交付质量上也可圈可点。
项目02 为 MatrixOne 混沌自动化测试工程注入故障工具及模块
基于当前业界混沌测试相关的理论以及相关开源工具,实现基于分布式系统的混沌测试自动化能力,主要包括如下核心模块和能力:
- 故障注入模块,基于开源或定制开发的故障注入工具,可实现基于配置策略,自动向被测系统进行故障/错误注入,故障/错误恢复以及详细的持久化日志记录。
- 执行器模块,提供一些列标准的接口或配置等,实现一个统一的执行器可执行、监控各种异构的测试工具和测试场景。
- 结果分析模块,对故障注入/恢复数据、测试场景执行过程和结果数据进行分析并进行可视化展示。
完成人:潘行健
对应PR:https://github.com/matrixorigin/mo-chaos-driller/pull/17
导师点评:
潘行健整体掌握了故障注入工具项目的具体需求,并实现了设计框架开发,功能完成度很高,其中指出对故障注入场景覆盖有更好的实现方法并修改,减少了代码冗余。在项目之外,潘行健也积极和导师沟通,并按时完成项目任务。
感谢所有参与过开源之夏的同学,感谢你们的辛勤付出,MatrixOne 因你们而更加优秀!
关于矩阵起源
矩阵起源是是业界领先的大数据及数据库管理系统(DBMS)技术和服务提供商,主要团队成员来自国内外知名科技公司,具备强大的创新能力。矩阵起源的目标是打造并使用世界一流的数据基础设施技术和产品,协助企业实现从信息化、数字化到智能化的转型和升级。矩阵起源在云计算、数据库、大数据及人工智能相关领域拥有核心竞争力,具备广阔的行业和国际视野以及前瞻性,能够快速有效的将先进技术在不同领域实用化并规模化扩展。
关于MatrixOne
矩阵起源的核心产品MatrixOne,是基于云原生技术,可同时在公有云和私有云部署的多模数据库。该产品使用存算分离、读写分离、冷热分离的原创技术架构,能够在一套存储和计算系统下同时支持事务、分析、流、时序和向量等多种负载,并能够实时、按需的隔离或共享存储和计算资源。MatrixOne能够帮助用户大幅简化日益复杂的IT架构,提供极简、极灵活、高性价比和高性能的数据服务。
MatrixOrigin 官网:新一代超融合异构开源数据库-矩阵起源(深圳)信息科技有限公司 MatrixOne
Github 仓库:GitHub - matrixorigin/matrixone: Hyperconverged cloud-edge native database
关键词:超融合数据库、多模数据库、云原生数据库、国产数据库