一、峰会简介
正如From、Join、排序等是SQL的基本算子,存储与计算是也是数据架构中数据生产与消费的基本算子,对于数据架构之下的技术栈层级,我们可将其定义为数据基础架构。
数据存储技术在适应大数据时代的规模需求基础之上,持续优化可用性、可靠性、存算分离、事务性等能力,演变出分布式文件系统、分布式对象存储、分布式块存储三大类型,数据库也通过存储格式等方面的改进助力数据处理的加速等应用需求。为适应AI的迅速发展,对非结构化数据、图数据等原始数据形式的存储支持以提高数据表达能力,或者对AI算法架构中间产物向量表示的存储支持以提高处理效率,都是不可小视的发展趋势,特别是后者已经在大模型推动下成为行业热门,即向量数据库。
数据计算以离线计算和实时计算为两大主要技术路线,离线计算引擎以Spark为主导,实时计算引擎以Flink为主导,规模化仍是第一特点,而前者发展较成熟,后者则在往云原生、流批一体、流式数仓、流式数据库等方向迅速发展,但在实际应用中,这两大引擎仍需要根据业务需求,进行大量的技术优化。
本次峰会设立分布式存储架构、大规模存储架构、数据存储应用、向量数据库架构、离线计算架构、实时计算架构、大规模计算架构、数据计算应用等8个主题论坛。
二、峰会核心资料清单
大规模存储架构
大规模计算架构
分布式存储架构与优化
离线计算架构
实时计算架构
数据存储应用实践
数据计算应用实践
向量数据库架构与实践
三、峰会核心资料截图示例
四、获取大会核心PPT全套资料
百度搜索 "百家峰会” ,或点击下方链接获取。
百家峰会,提供全球技术峰会前沿资料,大数据峰会、人工智能峰会、元宇宙峰会、数字孪生峰会、软件开发者大会等各类会议核心PPT课件文件,点击下方链接获取。