近期生产环境固定凌晨报错,提示
ConnectionManager [Thread-23069] getWriteConnection db:***,pattern: error, jdbcUrl: jdbc:mysql://***:3306/***?connectTimeout=3000&socketTimeout=180000&autoReconnect=true&zeroDateTimeBehavior=CONVERT_TO_NULL&characterEncoding=utf8 java.sql.SQLException: interrupt at com.alibaba.druid.pool.DruidDataSource.getConnectionInternal(DruidDataSource.java:1430) ~[druid-1.1.12.jar!/:1.1.12] at com.alibaba.druid.pool.DruidDataSource.getConnectionDirect(DruidDataSource.java:1272) ~[druid-1.1.12.jar!/:1.1.12] at com.alibaba.druid.filter.FilterChainImpl.dataSource_connect(FilterChainImpl.java:5007) ~[druid-1.1.12.jar!/:1.1.12] at com.alibaba.druid.filter.FilterAdapter.dataSource_getConnection(FilterAdapter.java:2745) ~[druid-1.1.12.jar!/:1.1.12]
排查,发现这个点有在执行定时任务,查看代码逻辑,比较简单,查询db,然后循环插入db,也没有其他逻辑,一般报这个错有一下几个原因:
-
线程中断:在获取连接的过程中,应用程序的线程被中断。例如,通过调用Thread.interrupt()方法中断了正在获取连接的线程
-
db连接超时设置过小:如果连接池的连接超时时间设置得太小,那么当应用程序的线程获取连接时,如果等待时间超过了设置的超时时间,也会抛出这个异常
但是代码中并没有主动调Thread.interrupt()的地方,把链接时间调大后问题还是没有解决。
但是看到观察到这个定时任务执行时间很长,需要几分钟,查看xxl-job的调度handler代码,发现其是异步执行业务逻辑代码,同时设置了获取结果的超时时间,如果超时,则产生了中断信号,如下:
我们的定时任务也确实配置了超时时间200s,低于我们的业务执行耗时,这下问题定位到了,有两种解决:
- 定时任务超时时间超大
- 定时任务,业务代码异步执行
总结一下:在使用xxl-job的时候如果出现了类似java.sql.SQLException: interrupt的问题,看下是不是自己的任务执行时间超过了配置的定时任务超时时间