Apache Commons Pool——优化你的java内存

大家好,我是吉森。我会持续分享一些开发技巧、经验和技术,如果你也热爱各种开发技术,欢迎关注我。

今天我们继续介绍Apache Commons工具包,今天的主角是:Commons Pool。简单地说,它是对象池技术的一套实现。

入门级介绍

开始之前,有必要啰嗦几句什么是对象池。

对象池,顾名思义,是一个存放对象的池子。我们使用对象的时候,可以从池中借出对象,完成任务后把对象归还回池中。对象池可以算做一种设计模式,它是单例模式的变种。单例模式是我们在整个应用中只能创建一个对象,而对象池模式是我们在应用中可以创建有限多个对象。

为什么用对象池?很多用来代表资源的大对象,它们在创建和销毁时的内存消耗都比较大,这种情况下我们垃圾收集器的负担很重。一旦创建了过多的资源对象而没有及时回收,就可能造成内存溢出 (OOM)问题。

下面就让我们关注一下通过Apache Commons Pool工具怎么创建对象池。

示例代码

// 创建一个通用的对象池
ObjectPool<Object> pool = new GenericObjectPool<>(new BasePooledObjectFactory<>() {
    // 创建对象的方法                                              
    @Override
    public Object create() {
        return new Object();
    }

    // 将对象包装成池中的对象 
    @Override
    public PooledObject<Object> wrap(Object obj) {
        return new DefaultPooledObject<>(obj);
    }
});

Object obj;
try {
    // 从对象池中借中对象
    obj = pool.borrowObject();
    try {
        // 使用对象
        doSomething(obj);
    } catch(Exception e) {
        // 让对象失效
        pool.invalidateObject(obj);
        // do not return the object to the pool twice
        obj = null;
    } finally {
        // 返还对象
        if(null != obj) {
            pool.returnObject(obj);
        }
    }
} catch(Exception e) {
    // 借出对象失败的处理
    e.printStackTrace();
}

进一步分析

从上面的示例代码中,我们可以看出,在对象池创建过程中的两个关键接口是ObjectPoolPooledObjectFactory

ObjectPool就是对象池,创建时需要加上泛型表明对象池中存储对象的类型,其中最常用的实现类是GenericObjectPool。我们可以通过在构造器中额外加入一个GenericObjectPoolConfig对象来配置对象池,主要配置项包括最小空闲对象数、最大空闲对象数以及最大总对象数。

创建GenericObjectPool时,我们需要重写两个方法,即createwrap。我们注意到create方法没有任何参数,说明对象池中的对象是完全一样的,即对象之间是equals的关系。wrap方法是告诉程序我们怎么将对象包装为池化对象,通常使用默认方式即可。

PooledObjectFactory是用于定义对象池中对象的生命周期方法的接口。换句话上,对象池创建、激活、销毁对象等过程其实都是调用PooledObjectFactory中的方法来实现的。主要的生命周期方法包括:

// 创建对象
PooledObject<T> makeObject() throws Exception;

// 销毁对象
void destroyObject(PooledObject<T> p) throws Exception;

// 确保对象有效
boolean validateObject(PooledObject<T> p);

// 重新初始化对象
void activateObject(PooledObject<T> p) throws Exception;

// 将对象重置为未初始化的状态
void passivateObject(PooledObject<T> p) throws Exception;

从池中取出对象和归还对象就比较简单了,直接调用borrowObjectreturnObject方法即可,借出对象的时候先检查闲置的对象是否可用,再检查所有对象是否要用,如果都不可用并且池中对象还未达到最大数量,则在池中创建新的对象。

其他对象池

除了GenericObjectPool外,Commons Pool还提供了其他几种对象池的对象。

  1. SoftReferenceObjectPool,即软引用对象池。我们都知道,在JVM中,软引用对象是指GC可以根据内存需要自主决定是否清理的对象。因此这种对象池不存在容量已满的情况,内存不足时,池中的对象会被GC回收。
  2. KeyedObjectPool,即有主键的对象池。前面提到GenericObjectPool中所有的对象都是一样的,KeyedObjectPool则是通过不同的key来标记不同的对象。KeyedObjectPool是一个接口,根据实现类不同,可以是一个key对应一个对象或多个对象。
  3. SynchronizedObjectPool,顾名思义,是线程安全的对象池。它是一个内部类,不能直接创建,需要通过PoolUtils.synchronizedPool方法将现有的对象池转为SynchronizedObjectPool。如果原对象池是KeyedObjectPool,则会包装为SynchronizedKeyedObjectPool。
  4. ErodingObjectPool,指不断衰减的对象池。它也是一个内部类,表示对象池的size将在闲置对象不再需要时不断地减少。不能直接创建,需要通过PoolUtils.erodingPool方法将现有的对象池转为ErodingObjectPool。这种线程池的效率比较高,通常采用FIFO(先进先出)的顺序来移除对象。

应用场景

最后说说什么时候使用对象池,以及对象池的优缺点。

对象池主要减少了创建对象和销毁对象的开销,因此一定是对象创建和销毁内存开销较大的情况下,才需要使用对象池,这些情况主要包括网络连接、数据库连接、图形图像处理等。

数据库连接池、线程池等都属于对象池,但是它们都有更特定的解决方案,通常不会使用Apache Commons Pool。根据maven网站上的统计,应用了Commons Pool的知名第三方库主要包括jedis (redis连接驱动)、Spring data redis (spring连接redis)、lettuce (redis连接驱动)、ActiveMQ Pool (消息队列)、Jmeter components (压力测试)、RabbitMQ backend (消息队列)等。可以看出,这些应用的普遍特点就是内存开销比较大。

因此,我们也应该仅在创建内存开销较大的对象时,主动使用对象池。

敲黑板啦~

引入Commons-Pool

<!-- https://mvnrepository.com/artifact/org.apache.commons/commons-pool2 -->
<dependency>
    <groupId>org.apache.commons</groupId>
    <artifactId>commons-pool2</artifactId>
    <version>2.9.0</version>
</dependency>

参考资料

Apache Commons官方网站

今天介绍的内容就到这里了,感谢观看。

什么,还没看够?关注我看更多技术干货~

原文链接:,转发请注明来源!