Apache SeaTunnel 正式发布2.3.5版本,功能增强及多个Bug修复

经过两个月的筹备,我们在2.3.4版本基础上进行了新一轮的迭代,本次更新不仅修复了多个关键问题,还引入了若干重要功能增强和性能优化。

file

在此,我们先提前感谢社区成员的贡献和支持,如果你想升级最新的版本,快跟我们一起来看看这次更新的亮点吧!

Release Note:https://github.com/apache/seatunnel/releases/tag/2.3.5

下载地址:https://seatunnel.apache.org/download/

主要新功能

支持作业事件通知功能,在此基础上支持实时CDC数据数据延迟事件通知(https://github.com/apache/seatunnel/pull/6634) 用户可以自定义通知消息发送的目标端,这样一旦实时同步数据发延迟,用户就会收到消息。

文件类型的连接器,支持定义读取和写入时使用的字符编码,这在源端和目标端使用不同的字符编码时非常有用。

优化了Postgres CDC创建publication的逻辑,在这个优化之前,添加Postgres CDC的表时创建的publication的范围是ALL_TABLES,这会导致即使只同步少数的几张表也会创建一个针对所有表的发布,会造成PG WAL的无效增长。社区优化了publication的创建逻辑,只针对需要同步的表创建publication,这极大的减小了WAL增长的范围,提交了稳定性。

Zeta引擎支持设置任务的失败重试次数。之前Zeta引擎任务失败会自动重试3次,但有些场景下我们可能希望一但有错任务立即终止,由外部调度系统来进行重试。从2.3.5版本开始,用户可以通过在env中设置job.retry.times = 0来关闭自动重试。

关键Bugfix

Zeta引擎支持classloader cache功能,如果连接器已经加载到jvm中,Zeta引擎会缓存该classloader,下次再提交该种连接器对应的任务会使用缓存的classloader不再创建新的classloader,这种方式解决了提交大量任务时Zeta JVM metaspace内存增长的问题,解决了metaspace内存溢出的bug。

修复了SQL Transform精度丢失的问题,比如timestamp类型的字段可以保留之前的精度信息。

Bug fix

Core

  • [fix] 修复获取 SeaTunnel 空指针异常问题 (#6681)
  • [Hotfix] 解决默认表格问题 (#6352)
  • [Chore] 修正文件拼写错误 (#6606)
  • [BugFix][Spark-translation] 修复映射类型转换错误 (#6552)
  • [Hotfix] 修复 Spark 示例问题 (#6486)
  • [Hotfix] 解决编译错误 (#6463)

Transformer

  • [Fix][SQLTransform] 修复 SQL 转换中的精度丢失问题 (#6553)
  • [Bug] 修复 SQLTransform 中的负常量错误 (#6533)

Connectors

  • [Fix][Kafka-Sink] 修复 Kafka Sink端选项规则 (#6657)
  • [Hotfix] 修复 HTTP 源无法正确读取 'yyyy-MM-dd HH:mm:ss' 格式并优化日期时间工具 (#6601)
  • [Bug] 修复 OrcWriteStrategy/ParquetWriteStrategy 在 Kerberos 登录时的问题 (#6472)
  • [Fix][Doc] 修正 FTP Sink端配置中的 'username' 键为 'user' (#6627)
  • [E2E] 修复 Amazon DynamoDB 集成测试的不稳定问题 (#6640)
  • [Fix][Connector-V2] 当分区已存在时修正添加 Hive 分区的错误 (#6577)
  • [Fix][Connector-V2] 修正 Doris/StarRocks 创建表 SQL 解析错误 (#6580)
  • [Fix][Connector-V2] 修复 Doris Sink端在流加载未读取任何数据时不能关闭的问题 (#6570)
  • [Fix][Connector-V2] 修复连接器支持 SPI 但缺少无参构造器的问题 (#6551)
  • [Fix][Connector-V2] 修复 Doris 源选择字段丢失主键信息 (#6339)
  • [Fix][FakeSource] 修复模板随机生成不包含最新值的问题 (#6438)
  • [Fix][Connector-V2] 修复 MongoDB CDC 启动模式选项值错误 (#6338)
  • [BugFix][Connector-file-sftp] 修复 SFTPInputStream.close 未正确触发文件流关闭的问题 (#6323) (#6329)
  • [Fix] 修复 Doris 流加载失败未报告错误的问题 (#6315)
  • [fix][connector-rocketmq] 修复当 checkpoint.interval 设置过小导致的空指针异常问题 (#6624)
  • [Bugfix][TDengine] 修复因多次调用提交作业 REST API 导致驱动丢失的问题 #6581 (#6596)
  • [Fix][StarRocks] 修复上游 catalogtable 表路径仅有表名部分时的空指针异常 (#6540)

Formats

  • [Bug] [formats] 修复内容包含文件分隔符时无法解析行的问题 (#6589)

Zeta(ST-Engine)

  • [Hotfix] 修复 HTTP 源无法正确读取 'yyyy-MM-dd HH:mm:ss' 格式并优化日期时间工具 (#6601)
  • [Fix][Zeta] 修复因保存点检查机制引起的线程卡死问题 (#6568)
  • [Fix][Zeta] 改进本地模式下的 Hazelcast 连接 (#6521)
  • [Fix][Zeta] 修复在使用缓存模式时线程类加载器被设置为 null 的问题 (#6509)
  • [Bug] [zeta] 修复提交作业时的空指针异常 (#6492)
  • [bugfix] [Zeta] 修复使用 REST API 提交作业时类加载器未释放的问题
  • [BUG][Zeta] 工作名称显示错误 #6470
  • [Hotfix][Zeta] 修复模式变更时的作业死锁 (#6389)

E2E

  • [E2E] 启用 StarRocksCDCSinkIT (#6626)

Improve

  • [Doc][Improve] 增加 seatunnel-engine 中文支持 (#6656)
  • [Doc][Improve] 为 start-v2/locally/quick-start-flink.md 和 start-v2/locally/quick-start-spark.md 增加中文支持 (#6412)
  • [Improve] 为 IDEA 添加图标 (#6394)
  • [Improve] 为 ReadonlyConfig::toConfig 添加过时注释 (#6353)
  • [Improve][RestAPI] 调用 getJobInfoById API 时始终返回 jobId (#6422)
  • [Improve][RestAPI] 当作业完成时返回已完成的作业信息 (#6576)
  • [Improve] 提升 MultiTableSinkWriter 准备提交性能 (#6495)
  • [Improve] 增加保存模式的处理细节日志 (#6375)
  • [Improve][API] 统一数据和类型系统 API (#5872)
  • [Improve] 优化使用 Parquet 读取时的类型转换错误 (#6683)
  • [Improve][Connector-V2] 支持 Redis 的多表汇出功能 (#6314)
  • [Improve][Connector-V2] 优化 Oracle CDC 端到端测试 (#6232)
  • [Improve][Connector-V2] 支持 HTTP Sink端的多表功能 (#6316)
  • [Improve][Connector-V2] 支持 INFINI Easysearch (#5933)
  • [Improve][Connector-V2] 支持 Hadoop HA 和 Kerberos 的 Paimon Sink端 (#6585)
  • [Improve][CDC-Connector] 修复 CDC 选项规则 (#6454)
  • [Improve][CDC] 优化快照分割读取时的内存分配 (#6281)
  • [Improve][Connector-V2] 在 StarRocks 上支持 TableSourceFactory (#6498)
  • [Improve][Jdbc] 使用 varchar2 数据类型在 Oracle 中存储字符串 (#6392)
  • [Improve] StarRocksSourceReader 使用现有客户端 (#6480)
  • [Improve][JDBC] 优化获取 JDBC 字段类型的代码风格 (#6583)
  • [Improve][Connector-V2] 增加 ElasticSearch 类型转换器 (#6546)
  • [Improve][Connector-V2] 支持使用架构配置读取 ORC 并进行类型转换 (#6531)
  • [Improve][Jdbc] 支持大门数据库的自定义大小写敏感配置 (#6510)
  • [Improve][Jdbc] 自动创建表时增加类型转换器 (#6617)
  • [Improve][CDC] 优化增量阶段的分割状态内存分配 (#6554)
  • [Improve][CDC] 优化记录中不包含架构字段时的读取性能 (#6571)
  • [Improve][Jdbc] 为 SQL 添加引用标识符 (#6669)
  • [Improve] 在 SelectDB 云Sink端禁用 2PC (#6266)
  • [Doc][Improve] 为 Kafka 连接器增加 Kerberos 认证支持 #6653

CI

  • [CI] 修复 CI 配置文件中仓库名称的错误 (#4795)

Zeta(ST-Engine)

  • [Improve][Zeta] 增加类加载器缓存模式以修复元空间泄漏 (#6355)
  • [Improve][Test] 修复 ResourceManager 和 EventReport 模块测试不稳定的问题 (#6620)
  • [Improve][Test] 代码合并到开发分支时运行所有测试 (#6609)
  • [Improve][Test] 使类加载器缓存测试更稳定 (#6597)
  • [Improve][Zeta][storage] 更新 HDFS 配置,支持更多参数 (#6547)
  • [Improve][Zeta] 优化 RestHttpGetCommandProcessor#getSeaTunnelServer() 的逻辑 (#6666)

Transformer

  • [Improve][Transform] Sql transform 支持内部结构查询 (#6484)
  • [Improve][Transform] 解析转换过程中移除后备操作 (#6644)
  • [Improve][Transform] 移除找不到字段的异常 (#6691)

Feature

  • [Feature][Tool] 增加连接器检查脚本,解决问题 #6199 (#6635)
  • [Feature][Core] 支持在 CDC 源监听消息延迟事件 (#6634)
  • [Feature][Core] 支持作业事件监听 (#6419)
  • [Feature][connector-v2] 添加 XuguDB 连接器 (#6561)
  • [Feature][Connector-V2] 支持 Paimon 的多表汇出功能 #5652 (#6449)
  • [Feature][Connectors-V2][File] 支持为文件源/Sink端指定编码 (#6489)
  • [Feature][Connector] 更新 PgSQL-CDC 发布以添加表 (#6309)
  • [Feature][Paimon] 支持指定 Paimon 表写入属性、分区键和主键 (#6535)
  • [Feature][Feature] 支持 Doris DateTimeV2 类型的 (#6358)
  • [Feature][Feature] 支持 SelectDB DateTimeV2 类型的 (#6332)
  • [Feature][Feature] 支持 Iceberg Sink连接器 #6198 (#6265)

Zeta(ST-Engine)

  • [Zeta] 支持在作业配置中设置作业重试次数 (#6690)

Docs

  • [Docs] 修复 kafka 格式的拼写错误 (#6633)
  • [Fix][Doc] 修正一些文档中的链接 (#6673)
  • [Fix][Doc] 修正一些拼写错误 (#6628)
  • [Fix][Doc] 修正 StarRocks Sink端文档中的排版错误 (#6579)
  • [Hotfix][Doc][Chinese] 修复关于配置日志相关参数的无效链接 (#6442)
  • [Fix][Doc] 修正 Seatunnel Engine/checkpoint-storage.md 文档错误 (#6369)

贡献者名单

感谢所有为2.3.5版本做出贡献的社区成员,包括代码贡献者、文档撰写者和测试人员。Apache SeaTunnel的成功离不开每一个人的努力!

JetiaimeLeonYoahTyrantLucifer
ponxuEricJoy2048sunxiaojian
xiaochen-zhouCosmosNilightzhao
baicieHisoka-Xgitfortian
hailin0ruanwenjunshangeyao
corgy-wliunaijiedailai
taohaozhi1129LeonYoahnianhua99
xxzuoYalikWang

本文由 白鲸开源科技 提供发布支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/599147.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

26 JavaScript学习:JSON和void

JSON 英文全称 JavaScript Object NotationJSON 是一种轻量级的数据交换格式。JSON是独立的语言JSON 易于理解。 JSON 实例 简单的 JSON 字符串实例: "{\"name\": \"Alice\", \"age\": 25, \"city\": \"San Francisco\&…

【陀螺仪JY61P维特智能】通过单片机修改波特率和角度参考的方法

根据官方文档: 修改波特率 1.解锁:FF AA 69 88 B5 1.1延时200ms 2.修改波特率:FF AA 04 06 00 2.1切换已修改的波特率然后重新发送解锁和保存指令 2.2解锁:FF AA 69 88 B5 2.3延时200ms 4.保存: FF AA 00 00 00 XY轴角度参考 角度参考是以传感器当前的实际位置&…

8款常见的自动化测试开源框架

在如今开源的时代,我们就不要再闭门造车了,热烈的拥抱开源吧!本文针对性能测试、Web UI 测试、API 测试、数据库测试、接口测试、单元测试等方面,为大家整理了github或码云上优秀的自动化测试开源项目,希望能给大家带来…

近似消息传递算法(AMP)单测量模型(SMV)

1、算法解决问题 很多人致力于解决SLM模型的求逆问题,即知道观测值和测量矩阵(字典之类的),要求未知变量的值。SLM又叫做标准线性模型,后续又在此基础上进行升级变为广义线性模型。即SLM是yAxe,这里是线性…

数据分析必备:一步步教你如何用numpy改变数据处理(6)

介绍: NumPy 广播(Broadcasting)是指当两个形状不同的数组进行运算时,NumPy 有能力灵活地改变其中某个(些)数组的形状从而使得运算可以正常进行。 广播的规则主要包括以下几点: 当一个数组是一个…

C语言 函数概述

好 接下来 我们来讲函数 构建C程序的最佳方式 就是模块化程序设计 C语言中 最基本的程序模块被称为 函数 所以 这个知识点的重要性不言而喻 这里 我们讲个故事 诸葛亮六出祁山时 为了逼司马懿出战 派人送给力司马懿一件女人衣服 司马懿只是为使者 诸葛亮的饮食起居 使者感叹…

网络 IO 模式

同步 IO 与异步 IO 同步 IO 和异步 IO 是关于数据读写方式的两种不同模式。 同步 IO 是指在程序读写数据时,需要等待操作完成后才能继续执行后面的程序。这种模式下,当程序使用阻塞式 IO 时,会一直等待IO操作完成,程序会暂停执行…

笔试强训Day18 字符串 排序 动态规划

[编程题]压缩字符串(一) 题目链接&#xff1a;压缩字符串(一)__牛客网 (nowcoder.com) 思路&#xff1a; 跟着思路写就完了。 AC code&#xff1a; #include <iostream> #include<string> using namespace std; string a; string ans; int main() {cin >>…

【LAMMPS学习】八、基础知识(5.9)LAMMPS 近场动力学

8. 基础知识 此部分描述了如何使用 LAMMPS 为用户和开发人员执行各种任务。术语表页面还列出了 MD 术语,以及相应 LAMMPS 手册页的链接。 LAMMPS 源代码分发的 examples 目录中包含的示例输入脚本以及示例脚本页面上突出显示的示例输入脚本还展示了如何设置和运行各种模拟。 …

渲染农场怎么渲染照片级效果图?

当讨论3D渲染的真实性时&#xff0c;不可避免地会将目光投向渲染农场。这些基于云的计算大军&#xff0c;专门负责逐帧打造接近现实的画面效果&#xff0c;无论是在电影动画还是在效果图制作等行业&#xff0c;都扮演着重要的支撑角色。对观众来说&#xff0c;画面的真实性几乎…

面试中算法(删去n个数字后的最小值)

有一个整数&#xff0c;从该整数中去掉n个数字&#xff0c;要求剩下的数字形成的新整数尽可能小。 分析&#xff1a;使用栈的特性&#xff0c;在遍历原整数的数字时&#xff0c;让所有数字一个一个入栈&#xff0c;当某个数字需要被删除时&#xff0c;&#xff08;即栈顶数字&g…

开源模型应用落地-CodeQwen模型小试-探索更多使用场景(三)

一、前言 代码专家模型是基于人工智能的先进技术&#xff0c;它能够自动分析和理解大量的代码库&#xff0c;并从中学习常见的编码模式和最佳实践。这种模型可以提供准确而高效的代码建议&#xff0c;帮助开发人员在编写代码时避免常见的错误和陷阱。 通过学习代码专家模型&…

高效项目管理:如何利用zz-plan在线甘特图工具

作为项目管理人员&#xff0c;使用 zz-plan https://zz-plan.com/这样的在线甘特图协作软件可以极大地提高项目管理的效率和效果。以下是结合zz-plan特点的一些关键步骤&#xff1a; 1. 制定项目计划 在zz-plan上创建新的项目&#xff0c;定义项目目标、关键里程碑和最终期限。…

大学数据结构学不进去怎么办?

在开始前我有一些资料&#xff0c;是我根据网友给的问题精心整理了一份「数据结构的资料从专业入门到高级教程」&#xff0c; 点个关注在评论区回复“888”之后私信回复“888”&#xff0c;全部无偿共享给大家&#xff01;&#xff01;&#xff01;除了极少数的“算法天才”&a…

Google Play开发者账号为什么会被封?如何解决关联账号问题?

Google Play是Google提供的一个应用商店&#xff0c;用户可以在其中下载并安装Android设备上的应用程序、电影、音乐、电子图书等。Google Play是Android平台上较大的应用市场&#xff0c;包含了数百万个应用程序和游戏。但是谷歌对于上架应用的审核越趋严格&#xff0c;开发者…

全新Adobe利器:Project Neo为2D平面图像轻松添加3D立体效果

Adobe的崭新创意工具Project Neo&#xff0c;正以其独特的3D技术为传统的2D图像设计领域带来革命性的变化。这款工具的核心功能在于&#xff0c;它能够将原本平面的2D图像巧妙地转化为立体感十足的三维作品。 想象一下&#xff0c;你手中的图标、动画插图&#xff0c;在Projec…

XSS漏洞---XSS-labs通关教程

文章目录 前言一、pandas是什么&#xff1f;二、使用步骤 1.引入库2.读入数据总结 Level-1 过滤源码&#xff1a;无 pyload&#xff1a; name<script>alert(1)</script> Level-2 过滤源码&#xff1a;利用转译函数将特殊字符转译为实体字符 $str $_GET["…

软件系统概要设计说明书(实际项目案例整理模板套用)

系统概要设计说明书 1.整体架构 2.功能架构 3.技术架构 4.运行环境设计 5.设计目标 6.接口设计 7.性能设计 8.运行设计 9.出错设计 全文档获取进主页 软件资料清单列表部分文档&#xff08;全套可获取&#xff09;&#xff1a; 工作安排任务书&#xff0c;可行性分析报告&…

Spring Data JPA的一对一、LazyInitializationException异常、一对多、多对多操作

Spring Data JPA系列 1、SpringBoot集成JPA及基本使用 2、Spring Data JPA Criteria查询、部分字段查询 3、Spring Data JPA数据批量插入、批量更新真的用对了吗 4、Spring Data JPA的一对一、LazyInitializationException异常、一对多、多对多操作 前言 通过前三篇Sprin…

ISIS的基本配置

1.IS-IS协议的基本配置&#xff08;1&#xff09; 2.IS-IS协议的基本配置&#xff08;2&#xff09; 3.IS-IS协议的基本配置&#xff08;3&#xff09; 4.案例&#xff1a;IS-IS配置 R1的配置如下&#xff1a; [AR1czy]isis 1 [AR1czy-isis-1]is-level level-1 [AR1czy-isis-…