APP下载

用了这么久的数据库连线池 你知道原理吗?

消息来源:baojiabao.com 作者: 发布时间:2024-05-15

报价宝综合消息用了这么久的数据库连线池 你知道原理吗?

作者:敦格

原文:https://blog.csdn.net/shuaihj/article/details/14223015

这次我们采取技术演进的方式来谈谈数据库连线池的技术出现过程及其原理,以及当下最流行的开源数据库连线池jar包。

一、早期我们怎么进行数据库操作

1、原理

一般来说,Java应用程序访问数据库的过程是

①装载数据库驱动程式;

②通过jdbc建立数据库连线;

③访问数据库,执行sql语句;

④断开数据库连线。

2、程式码

3、分析

程式开发过程中,存在很多问题:首先,每一次web请求都要建立一次数据库连线。建立连线是一个费时的活动,每次都得花费0.05s~1s的时间,而且系统还要分配内存资源。这个时间对于一次或几次数据库操作,或许感觉不出系统有多大的开销。可是对于现在的web应用,尤其是大型电子商务网站,同时有几百人甚至几千人线上是很正常的事。在这种情况下,频繁的进行数据库连线操作势必占用很多的系统资源,网站的响应速度必定下降,严重的甚至会造成服务器的崩溃。不是危言耸听,这就是制约某些电子商务网站发展的技术瓶颈问题。其次,对于每一次数据库连线,使用完后都得断开。否则,如果程式出现异常而未能关闭,将会导致数据库系统中的内存泄漏,最终将不得不重启数据库。还有,这种开发不能控制被建立的连线物件数,系统资源会被毫无顾及的分配出去,如连线过多,也可能导致内存泄漏,服务器崩溃。

上述的使用者查询案例,如果同时有1000人访问,就会不断的有数据库连线、断开操作:

通过上面的分析,我们可以看出来,“数据库连线”是一种稀缺的资源,为了保障网站的正常使用,应该对其进行妥善管理。其实我们查询完数据库后,如果不关闭连线,而是暂时存放起来,当别人使用时,把这个连线给他们使用。就避免了一次建立数据库连线和断开的操作时间消耗。原理如下:

二、技术演进出来的数据库连线池

由上面的分析可以看出,问题的根源就在于对数据库连线资源的低效管理。我们知道,对于共享资源,有一个很著名的设计模式:资源池(resource pool)。该模式正是为了解决资源的频繁分配﹑释放所造成的问题。为解决上述问题,可以采用数据库连线池技术。数据库连线池的基本思想就是为数据库连线建立一个“缓冲池”。预先在缓冲池中放入一定数量的连线,当需要建立数据库连线时,只需从“缓冲池”中取出一个,使用完毕之后再放回去。我们可以通过设定连线池最大连线数来防止系统无尽的与数据库连线。更为重要的是我们可以通过连线池的管理机制监视数据库的连线的数量﹑使用情况,为系统开发﹑测试及效能调整提供依据。

我们自己尝试开发一个连线池,来为上面的查询业务提供数据库连线服务:

① 编写class 实现DataSource 界面

② 在class构造器一次性建立10个连线,将连线储存LinkedList中

③ 实现getConnection 从 LinkedList中返回一个连线

④ 提供将连线放回连线池中方法

1、连线池程式码

2、使用连线池重构我们的使用者查询函式

这就是数据库连线池的原理,它大大提供了数据库连线的利用率,减小了内存吞吐的开销。我们在开发过程中,就不需要再关心数据库连线的问题,自然有数据库连线池帮助我们处理,这回放心了吧。但连线池需要考虑的问题不仅仅如此,下面我们就看看还有哪些问题需要考虑。

三、连线池还要考虑更多的问题

1、并发问题

为了使连线管理服务具有最大的通用性,必须考虑多执行绪环境,即并发问题。这个问题相对比较好解决,因为java语言自身提供了对并发管理的支援,使用synchronized关键字即可确保执行绪是同步的。使用方法为直接在类方法前面加上synchronized关键字,如:

publicsynchronized connection getconnection

()

2、多数据库服务器和多使用者

对于大型的企业级应用,常常需要同时连线不同的数据库(如连线oracle和sybase)。如何连线不同的数据库呢?我们采用的策略是:设计一个符合单例模式的连线池管理类,在连线池管理类的唯一例项被建立时读取一个资原始档,其中资原始档中存放着多个数据库的url地址等资讯。根据资原始档提供的资讯,建立多个连线池类的例项,每一个例项都是一个特定数据库的连线池。连线池管理类例项为每个连线池例项取一个名字,通过不同的名字来管理不同的连线池。

对于同一个数据库有多个使用者使用不同的名称和密码访问的情况,也可以通过资原始档处理,即在资原始档中设定多个具有相同url地址,但具有不同使用者名称和密码的数据库连线资讯。

3、事务处理

我们知道,事务具有原子性,此时要求对数据库的操作符合“all-all-nothing”原则即对于一组sql语句要么全做,要么全不做。

在java语言中,connection类本身提供了对事务的支援,可以通过设定connection的autocommit属性为false 然后显式的呼叫commit或rollback方法来实现。但要高效的进行connection复用,就必须提供相应的事务支援机制。可采用每一个事务独占一个连线来实现,这种方法可以大大降低事务管理的复杂性。

4、连线池的分配与释放

连线池的分配与释放,对系统的效能有很大的影响。合理的分配与释放,可以提高连线的复用度,从而降低建立新连线的开销,同时还可以加快使用者的访问速度。

对于连线的管理可使用空闲池。即把已经建立但尚未分配出去的连线按建立时间存放到一个空闲池中。每当使用者请求一个连线时,系统首先检查空闲池内有没有空闲连线。如果有就把建立时间最长(通过容器的顺序存放实现)的那个连线分配给他(实际是先做连线是否有效的判断,如果可用就分配给使用者,如不可用就把这个连线从空闲池删掉,重新检测空闲池是否还有连线);如果没有则检查当前所开连线池是否达到连线池所允许的最大连线数(maxconn)如果没有达到,就新建一个连线,如果已经达到,就等待一定的时间(timeout)。如果在等待的时间内有连线被释放出来就可以把这个连线分配给等待的使用者,如果等待时间超过预定时间timeout 则返回空值(null)。系统对已经分配出去正在使用的连线只做计数,当使用完后再返还给空闲池。对于空闲连线的状态,可开辟专门的执行绪定时检测,这样会花费一定的系统开销,但可以保证较快的响应速度。也可采取不开辟专门执行绪,只是在分配前检测的方法。

5、连线池的配置与维护

连线池中到底应该放置多少连线,才能使系统的效能最佳?系统可采取设定最小连线数(minconn)和最大连线数(maxconn)来控制连线池中的连线。最小连线数是系统启动时连线池所建立的连线数。如果建立过多,则系统启动就慢,但建立后系统的响应速度会很快;如果建立过少,则系统启动的很快,响应起来却慢。这样,可以在开发时,设定较小的最小连线数,开发起来会快,而在系统实际使用时设定较大的,因为这样对访问客户来说速度会快些。最大连线数是连线池中允许连线的最大数目,具体设定多少,要看系统的访问量,可通过反复测试,找到最佳点。

如何确保连线池中的最小连线数呢?有动态和静态两种策略。动态即每隔一定时间就对连线池进行检测,如果发现连线数量小于最小连线数,则补充相应数量的新连线以保证连线池的正常运转。静态是发现空闲连线不够时再去检查。

四、实际开发中有成熟的开源连线池供我们使用

理解了连线池的原理就可以了,没有必要什么都从头写一遍,那样会花费很多时间,并且效能及稳定性也不一定满足要求。事实上,已经存在很多流行的效能优良的第三方数据库连线池jar包供我们使用。如:

Apache commons-dbcpc3p0DruidHikariCP其中c3p0已经很久没有更新了。DBCP更新速度很慢,基本处于不活跃状态,而Druid和HikariCP处于活跃状态的更新中。

2020-01-05 08:50:00

相关文章