org.apache.tomcat.dbcp.dbcp.SQLNestedException: Cannot get a connection, pool error Timeout waiting for idle object

ERROR [org.apache.tomcat.dbcp.dbcp.SQLNestedException: Cannot get a connection, pool error Timeout waiting for idle object]

问题描述:

系统在sit测试过程中,经常突然无法访问,重启服务就又可以正常运行一段时间,然后突然又无法访问,系统出现假死状态,反复如此!

重启虽然是万能的,但不能根据解决问题,严重影响sit 测试进展,必须尽快找出原因并解决,况且有这种问题出现系统是无法上生产的。

问题分析解决过程及思路:

1、系统有问题,程序员首当其冲就是日志分析,如下,最早显示 Session not established or timeout!(session超时)

分析e4a及cmis的session的处理代码,没发现什么问题。

--------日志-----------

10:11:43.047 [http-8080-6] ERROR c.m.f.f.s.filter.MideaSSOLoginFilter - sso client sessionid 53F0A1AD92CA1126F1D22C0291F6CED3

[2016-10-21 10:11:43,049 INFO] Accept request: /cmis.ecf/queryPAuthList.do

[2016-10-21 10:11:43,049 DEBUG] Get user's locale settings via session...

[2016-10-21 10:11:43,049 DEBUG] Process request: /cmis.ecf/queryPAuthList.do throws Exception:

com.ecc.emp.session.SessionException: Session not established or timeout!

--------日志----------

2、继续分析日志,找到最初报错的地方(日志如下):Name WFDataSource is not bound in this Context,

报错的意思是系统上下文中没找到数据源,即是请求在连接数据源时出错了。

2016-10-21 15:50:50,134 INFO Transaction - Apply new connection from data source...

2016-10-21 15:50:50,135 ERROR DataSource - Failed to initialize data Source jndiName=java:comp/env/WFDataSource

javax.naming.NameNotFoundException: Name WFDataSource is not bound in this Context

at org.apache.naming.NamingContext.lookup(NamingContext.java:770)

3、根据上2,找度娘综合分析出是由于tomcat配置的数据库连接池的连接已经被占用了,但没有被释放,导致后面的请求无法再连接数据库

,因而报错,导致系统也会出现假死状态,无法登入。

4、查看tomcat数据源连接配置,发现参数maxActive(最大连接数)配置为20,且removeAbandoned(启动连接回收)默认为false,即不开启。

也就是说超过20个连接时就会出问题,请求就无法连接上数据源。可以查看数据库监控看连接数。

5、据4分析 只能增加连接数了,刚开始只修改了maxActive为50,没有开启removeAbandoned,连接还是不够用,问题还是会反复出现。

6、最后修改maxActive为200,且removeAbandoned=“true”, removeAbandonedTimeout="180" (超时180s自动回收池连接),困扰一个星期的问题得以解决!

最后附上tomcat dbcp数据源连接配置说明:

在使用tomcat数据库连接池时,应当加入以下标红的两个参数定时去回收释放时间超时的连接资源。

initialSize :连接池启动时创建的初始化连接数量(默认值为0)

maxActive :连接池中可同时连接的最大的连接数(自己根据应用场景定)

maxIdle:连接池中最大的空闲的连接数,超过的空闲连接将被释放,如果设置为负数表示不限制(默认为8个,maxIdle不能设置太小,

因为假如在高负载的情况下,连接的打开时间比关闭的时间快,会引起连接池中idle的个数 上升超过maxIdle,而造成频繁的连接销毁和创建,类似于jvm参数中的Xmx设置)

minIdle:连接池中最小的空闲的连接数,低于这个数量会被创建新的连接(默认为0,调整为5,该参数越接近maxIdle,性能越好,

因为连接的创建和销毁,都是需要消耗资源的;但是不能太大,因为在机器很空闲的时候,也会创建低于minidle个数的连接,类似于jvm参数中的Xmn设置)

maxWait :最大等待时间,当没有可用连接时,连接池等待连接释放的最大时间,超过该时间限制会抛出异常,

如果设置-1表示无限等待(默认为无限,调整为60000ms,避免因线程池不够用,而导致请求被无限制挂起)

poolPreparedStatements:开启池的prepared(默认是false,未调整,经过测试,开启后的性能没有关闭的好。)

maxOpenPreparedStatements:开启池的prepared 后的同时最大连接数(默认无限制,同上,未配置)

minEvictableIdleTimeMillis :连接池中连接,在时间段内一直空闲, 被逐出连接池的时间

(默认为30分钟,可以适当做调整,需要和后端服务端的策略配置相关)

removeAbandonedTimeout :超过时间限制,回收没有用(废弃)的连接(默认为 300秒,调整为180)

removeAbandoned :超过removeAbandonedTimeout时间后,是否进 行没用连接(废弃)的回收(默认为false,调整为true

如果开启" removeAbandoned ",那么连接在被认为超时时可能被池回收. 这个机制在(getNumIdle() < 2) and (getNumActive() > getMaxActive() - 3)时被触发.

举例:当maxActive=20, 活动连接为18,空闲连接为1时可以触发" removeAbandoned ".但是活动连接只有在没有被使用的时间超过"removeAbandonedTimeout"时才被删除,默认300秒.在resultset中游历不被计算为被使用.

logAbandoned=true的话,将会在回收事件后,在log中打印出回收Connection的错误信息,包括在哪个地方用了Connection却忘记关闭了,在调试的时候很有用。

————————————————

版权声明:本文为CSDN博主「jacky_2015」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/jacky_2015/java/article/details/53064037