大家好,我是吉森。我会持续分享一些开发技巧、经验和技术,如果你也热爱各种开发技术,欢迎关注我。
今天我们继续介绍Apache Commons工具包,今天的主角是:Commons Pool。简单地说,它是对象池技术的一套实现。
入门级介绍
开始之前,有必要啰嗦几句什么是对象池。
对象池,顾名思义,是一个存放对象的池子。我们使用对象的时候,可以从池中借出对象,完成任务后把对象归还回池中。对象池可以算做一种设计模式,它是单例模式的变种。单例模式是我们在整个应用中只能创建一个对象,而对象池模式是我们在应用中可以创建有限多个对象。
为什么用对象池?很多用来代表资源的大对象,它们在创建和销毁时的内存消耗都比较大,这种情况下我们垃圾收集器的负担很重。一旦创建了过多的资源对象而没有及时回收,就可能造成内存溢出 (OOM)问题。
下面就让我们关注一下通过Apache Commons Pool工具怎么创建对象池。
示例代码
// 创建一个通用的对象池
ObjectPool<Object> pool = new GenericObjectPool<>(new BasePooledObjectFactory<>() {
// 创建对象的方法
@Override
public Object create() {
return new Object();
}
// 将对象包装成池中的对象
@Override
public PooledObject<Object> wrap(Object obj) {
return new DefaultPooledObject<>(obj);
}
});
Object obj;
try {
// 从对象池中借中对象
obj = pool.borrowObject();
try {
// 使用对象
doSomething(obj);
} catch(Exception e) {
// 让对象失效
pool.invalidateObject(obj);
// do not return the object to the pool twice
obj = null;
} finally {
// 返还对象
if(null != obj) {
pool.returnObject(obj);
}
}
} catch(Exception e) {
// 借出对象失败的处理
e.printStackTrace();
}
进一步分析
从上面的示例代码中,我们可以看出,在对象池创建过程中的两个关键接口是ObjectPool和PooledObjectFactory。
ObjectPool就是对象池,创建时需要加上泛型表明对象池中存储对象的类型,其中最常用的实现类是GenericObjectPool。我们可以通过在构造器中额外加入一个GenericObjectPoolConfig对象来配置对象池,主要配置项包括最小空闲对象数、最大空闲对象数以及最大总对象数。
创建GenericObjectPool时,我们需要重写两个方法,即create和wrap。我们注意到create方法没有任何参数,说明对象池中的对象是完全一样的,即对象之间是equals的关系。wrap方法是告诉程序我们怎么将对象包装为池化对象,通常使用默认方式即可。
PooledObjectFactory是用于定义对象池中对象的生命周期方法的接口。换句话上,对象池创建、激活、销毁对象等过程其实都是调用PooledObjectFactory中的方法来实现的。主要的生命周期方法包括:
// 创建对象
PooledObject<T> makeObject() throws Exception;
// 销毁对象
void destroyObject(PooledObject<T> p) throws Exception;
// 确保对象有效
boolean validateObject(PooledObject<T> p);
// 重新初始化对象
void activateObject(PooledObject<T> p) throws Exception;
// 将对象重置为未初始化的状态
void passivateObject(PooledObject<T> p) throws Exception;
从池中取出对象和归还对象就比较简单了,直接调用borrowObject和returnObject方法即可,借出对象的时候先检查闲置的对象是否可用,再检查所有对象是否要用,如果都不可用并且池中对象还未达到最大数量,则在池中创建新的对象。
其他对象池
除了GenericObjectPool外,Commons Pool还提供了其他几种对象池的对象。
- SoftReferenceObjectPool,即软引用对象池。我们都知道,在JVM中,软引用对象是指GC可以根据内存需要自主决定是否清理的对象。因此这种对象池不存在容量已满的情况,内存不足时,池中的对象会被GC回收。
- KeyedObjectPool,即有主键的对象池。前面提到GenericObjectPool中所有的对象都是一样的,KeyedObjectPool则是通过不同的key来标记不同的对象。KeyedObjectPool是一个接口,根据实现类不同,可以是一个key对应一个对象或多个对象。
- SynchronizedObjectPool,顾名思义,是线程安全的对象池。它是一个内部类,不能直接创建,需要通过PoolUtils.synchronizedPool方法将现有的对象池转为SynchronizedObjectPool。如果原对象池是KeyedObjectPool,则会包装为SynchronizedKeyedObjectPool。
- ErodingObjectPool,指不断衰减的对象池。它也是一个内部类,表示对象池的size将在闲置对象不再需要时不断地减少。不能直接创建,需要通过PoolUtils.erodingPool方法将现有的对象池转为ErodingObjectPool。这种线程池的效率比较高,通常采用FIFO(先进先出)的顺序来移除对象。
应用场景
最后说说什么时候使用对象池,以及对象池的优缺点。
对象池主要减少了创建对象和销毁对象的开销,因此一定是对象创建和销毁内存开销较大的情况下,才需要使用对象池,这些情况主要包括网络连接、数据库连接、图形图像处理等。
数据库连接池、线程池等都属于对象池,但是它们都有更特定的解决方案,通常不会使用Apache Commons Pool。根据maven网站上的统计,应用了Commons Pool的知名第三方库主要包括jedis (redis连接驱动)、Spring data redis (spring连接redis)、lettuce (redis连接驱动)、ActiveMQ Pool (消息队列)、Jmeter components (压力测试)、RabbitMQ backend (消息队列)等。可以看出,这些应用的普遍特点就是内存开销比较大。
因此,我们也应该仅在创建内存开销较大的对象时,主动使用对象池。
敲黑板啦~
引入Commons-Pool
<!-- https://mvnrepository.com/artifact/org.apache.commons/commons-pool2 -->
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-pool2</artifactId>
<version>2.9.0</version>
</dependency>
参考资料
Apache Commons官方网站
今天介绍的内容就到这里了,感谢观看。
什么,还没看够?关注我看更多技术干货~