简介
CopyOnWriteArraySet是一个线程安全的无序集合,它基于“写时复制”的思想实现。它继承自AbstractSet,可以将其理解成线程安全的HashSet。
CopyOnWriteArraySet在读取操作比较频繁、写入操作相对较少的情况下可以提高程序的性能和可靠性。它的线程安全机制和CopyOnWriteArrayList一样,是通过volatile和互斥锁实现的。
应用场景
CopyOnWriteArraySet的应用场景主要是在并发编程中,特别是那些需要高并发的场景。它适用于数据量较小且读多写少的场景,例如,一个Web应用程序中的用户状态信息,这是一个读取操作远多于写入操作的典型场景。
它的线程安全机制避免了在迭代过程中其他线程对集合的修改操作引发的并发冲突,使得在迭代过程中可以安全地进行读取操作。然而,由于CopyOnWriteArraySet的写时复制机制,它可能存在一些性能开销,因此,如果需要频繁的写入操作,可能不适合使用CopyOnWriteArraySet。
总的来说,CopyOnWriteArraySet适合用在读多写少、对数据一致性要求不高、对线程安全性要求高的场景。
性能问题
CopyOnWriteArraySet的性能问题主要集中在以下几个方面:
- 写操作的开销 :由于CopyOnWriteArraySet采用的是写时复制的策略,每次写操作都需要复制一份底层数组,这会导致写操作的开销比较大。如果写操作比较频繁,可能会影响程序的性能。
- 内存占用 :由于每次写操作都需要复制一份底层数组,这会导致内存占用比较高。如果集合中的元素数量比较大,可能会导致内存溢出的问题。
- 迭代器的性能 :由于CopyOnWriteArraySet的迭代器是基于底层数组的快照实现的,如果在迭代过程中底层数组发生变化,迭代器不会反映这些变化。这可能会导致迭代器的性能不稳定,甚至引发并发问题。
针对以上问题,可以考虑以下优化策略:
- 使用其他线程安全集合类 :如果写操作比较频繁,可以考虑使用其他线程安全集合类,如ConcurrentHashMap或ConcurrentSkipListSet等。这些集合类采用了不同的同步策略,可以更好地支持并发访问。
- 控制集合的大小 :如果集合中的元素数量比较大,可以考虑控制集合的大小,避免内存溢出的问题。例如,可以设置集合的最大容量,当元素数量超过最大容量时进行清理或压缩操作。
- 减少迭代操作 :如果迭代操作比较频繁,可以考虑减少迭代操作的次数或使用其他方式来访问集合中的元素。例如,可以使用流(Stream) API 来处理集合中的元素,避免使用迭代器。
需要注意的是,在选择和优化线程安全集合类时需要根据具体的应用场景和需求进行权衡和选择。
源码解析
CopyOnWriteArraySet的源码实现相对比较简单,主要基于CopyOnWriteArrayList实现。以下是对CopyOnWriteArraySet源码的简单讲解:
public class CopyOnWriteArraySet<E> extends AbstractSet<E> {
private final List<E> array;
public CopyOnWriteArraySet() {
this.array = new CopyOnWriteArrayList<>();
}
@Override
public boolean add(E e) {
return array.add(e);
}
@Override
public boolean remove(Object o) {
return array.remove(o);
}
@Override
public boolean contains(Object o) {
return array.contains(o);
}
@Override
public int size() {
return array.size();
}
@Override
public Iterator<E> iterator() {
return new COWIterator<>(array.listIterator());
}
}
在CopyOnWriteArraySet中,所有的操作都是通过调用CopyOnWriteArrayList的实现来完成的。CopyOnWriteArrayList的实现细节可以参考之前对CopyOnWriteArrayList的讲解。其中,COWIterator是一个简单的迭代器实现,用于包装ListIterator并确保线程安全。在迭代过程中,COWIterator会持有一个快照,不允许修改操作。
扩容机制
CopyOnWriteArraySet的扩容机制是基于CopyOnWriteArrayList实现的。当集合的元素数量超过当前数组的容量时,会创建一个新的数组,然后将原数组中的元素复制到新数组中。这个过程是线程安全的,因为整个复制过程是一个原子操作。
具体的扩容过程如下:
- 当集合的元素数量超过当前数组的容量时,会创建一个新的数组,大小是原数组的两倍。
- 然后将原数组中的元素复制到新数组中,每个元素复制的顺序是按照它们在原数组中的顺序。
- 复制完成后,将原数组清空,并将新数组赋值给集合的内部数组。
这种扩容机制的优点是可以在多线程环境下实现高效的并发访问,因为复制操作是一个原子操作,不会受到其他线程的干扰。同时,由于每次扩容时都会创建一个新的数组,因此可以避免因为元素插入导致的数组重新排列的开销。但是,由于每次扩容都需要创建一个新的数组并复制元素,所以如果集合中的元素数量非常大,扩容过程可能会比较耗时。
与CopyOnWriteArrayList的区别
CopyOnWriteArraySet和CopyOnWriteArrayList都是基于“写时复制”的思想实现的线程安全的数据结构,适用于读多写少的场景。它们的主要区别在于:
- 数据结构:CopyOnWriteArraySet是Set,而CopyOnWriteArrayList是List。因此,CopyOnWriteArraySet不允许存放重复值,而CopyOnWriteArrayList可以。
- 存储方式:CopyOnWriteArraySet内部持有一个CopyOnWriteArrayList引用,所有的操作都是由CopyOnWriteArrayList来实现的。它是无序的,不允许存放重复值。
- 迭代器行为:CopyOnWriteArraySet的迭代器使用了“快照”技术,存储了内部数组快照,不支持remove、set、add操作,但通过迭代器进行并发读取时效率很高。这是与CopyOnWriteArrayList的主要区别。
两者都是线程安全的数据结构,适用于读多写少的场景。主要区别在于数据结构、存储方式和迭代器行为。
代码示例
在多线程环境下,可以使用CopyOnWriteArraySet来保证线程安全。以下是一个简单的示例:
import java.util.concurrent.CopyOnWriteArraySet;
public class Example {
private static CopyOnWriteArraySet<String> set = new CopyOnWriteArraySet<>();
public static void main(String[] args) {
new Thread(() -> {
for (int i = 0; i < 5000; i++) {
set.add("a" + System.currentTimeMillis());
}
}).start();
new Thread(() -> {
for (int i = 0; i < 5000; i++) {
set.add("b" + System.currentTimeMillis());
}
}).start();
}
}
在这个示例中,我们创建了一个CopyOnWriteArraySet,并启动了两个线程,每个线程都向集合中添加元素。由于CopyOnWriteArraySet是线程安全的,因此在迭代过程中,其他线程对集合的修改操作不会引发并发冲突。
拓展
- 线程安全集合类
除了CopyOnWriteArraySet和CopyOnWriteArrayList,Java中还有其他一些线程安全的集合类,包括:
- ConcurrentHashMap:线程安全的Map实现,使用分段锁技术实现并发访问。
- ConcurrentSkipListMap:基于跳表(Skip List)实现的线程安全Map,具有较高的并发性能。
- ConcurrentLinkedQueue:基于链接节点的线程安全队列,支持高效的并发访问。
- ConcurrentSkipListSet:基于跳表(Skip List)实现的线程安全Set,具有较高的并发性能。
这些线程安全集合类的使用方法和普通的集合类类似,但它们能够在多线程环境下提供更好的并发性能和数据安全性。
-
CopyOnWriteArrayList讲解
快点我呀✋🏻 -
更多集合
ConcurrentLinkedDeque详解-Deque接口链表实现方案
ArrayDeque详解-Deque接口数组实现方案
LinkedList详解-Deque接口链表实现方案
Java中Deque接口方法解析