1.报错信息、背景
工作中起了几个访问ceph的服务pod节点,一段时间后1个节点一直报错
Unable to execute HTTP request: Timeout waiting for connection from pool
,详细i信息如下图片,有且仅有1个节点报错,其他节点访问正常。看日志内容为链接池满了,初步怀疑是ceph服务端
的连接池满了,但是为什么只有1个pod节点报错,其他节点报错??
后续通过查阅s3官网,了解到这个连接池为客户端自己维护的http连接池
2. 解决
2.1. 通过查询s3官网文档
https://docs.aws.amazon.com/zh_cn/sdk-for-java/latest/developer-guide/home.html –中文
https://docs.aws.amazon.com/sdk-for-java/latest/developer-guide/home.html –英文
- 第一个图片说明访问ceph是有连接池资源的
- 第二个图片说明ceph默认使用的http是apache httpclient,并且连接池指的是本地http连接池,并不是ceph服务端的连接池数量。
2.2. 修改httpclient连接池,验证问题
- 通过查看源码,默认连接池设置的是50个,可以修改为1个,方便测试复现问题。
software.amazon.awssdk.http.SdkHttpConfigurationOption
- 用jmeter多线程测试下载工程,马上会复现同样的报错。
- 参考官网,发现是代码中下载附件后未释放流,所以出现连接池占慢的情况,后续加上close方法,则解决。