新集合 - BiMap&Multimap&Multiset
BiMap
Map 可以实现 key -> value 的映射,如果想要 value -> key 的映射,就需要定义两个 Map,并且同步更新,很不优雅。Guava 提供了 BiMap 支持支持双向的映射关系,常用实现有HashMap, EnumBiMap, EnumHashBiMap...
。
而它对key和value严格的保证唯一性。如果使用put方法添加相同的value值或key值则会抛出异常:java.lang.IllegalArgumentException,如果使用forcePut方法添加则会覆盖掉原来的value值。
BiMap<String, Integer> biMap = HashBiMap.create();
biMap.put("A", 100);
// 删除已存在的 KV,重新添加 KV
biMap.forcePut("A", 200);
// 获取反向映射
BiMap<Integer, String> inverse = biMap.inverse();
log.debug("{}", inverse.get(100));
这里主要使用HashBiMap 进行分析
成员变量
private static final double LOAD_FACTOR = 1.0D;
// BiEntry是HashBiMap中为的Map.Entry接口的实现类,这里定义了两个BiEntry,一个是实现使用Key找到value的,另一个是实现使用value找到key的
private transient HashBiMap.BiEntry<K, V>[] hashTableKToV;
private transient HashBiMap.BiEntry<K, V>[] hashTableVToK;
private transient int size;
private transient int mask;
private transient int modCount;
private transient BiMap<V, K> inverse;
HashMap做的是唯一key值对应的value可以不唯一,而Bimap做的是唯一key值,value值也要唯一,方便从key找到value,从value找到key
private static final class BiEntry<K, V> extends ImmutableEntry<K, V> {
//key的hash值
final int keyHash;
//value的hash值
final int valueHash;
@Nullable
//为key链表做的指向下一个节点的变量
HashBiMap.BiEntry<K, V> nextInKToVBucket;
@Nullable
//为value链表做的指向下一个节点的变量
HashBiMap.BiEntry<K, V> nextInVToKBucket;
BiEntry(K key, int keyHash, V value, int valueHash) {
super(key, value);
this.keyHash = keyHash;
this.valueHash = valueHash;
}
}
对比一下HashMap的Node源码:
static class Node<K,V> implements Map.Entry<K,V> {
//因为HashMap实现的功能只需要key找到value,所以这里的hash值默认就是key的hash值
final int hash;
final K key;
V value;
//在HashMap中的链表只做key的链表就好,所以只需要一个指向下一个节点的变量
Node<K,V> next;
}
构造方法
//传入期望容器长度
private HashBiMap(int expectedSize) {
this.init(expectedSize);
}
可以看到构造方法是私有的,所以在类中一定会有静态方法构造器会用到这个私有的构造方法。
这个构造方法调用了init方法,可以看一下init方法的源码:
private void init(int expectedSize) {
CollectPreconditions.checkNonnegative(expectedSize, "expectedSize");
//经过closedTableSize方法运算达到期望的实际值
int tableSize = Hashing.closedTableSize(expectedSize, 1.0D);
//初始化key和value存储链表的数组
this.hashTableKToV = this.createTable(tableSize);
this.hashTableVToK = this.createTable(tableSize);
//初始化mask为数组最大小标值
this.mask = tableSize - 1;
//初始化modCount值为0
this.modCount = 0;
//初始化size值为0
this.size = 0;
}
静态方法构造器
public static <K, V> HashBiMap<K, V> create() {
//调用另一个create构造器,期望长度为16
return create(16);
}
public static <K, V> HashBiMap<K, V> create(int expectedSize) {
//直接创建一个长度为expectedSize的HashBiMap
return new HashBiMap(expectedSize);
}
public static <K, V> HashBiMap<K, V> create(Map<? extends K, ? extends V> map) {
//创建一个与传入map相同长度的biMap
HashBiMap bimap = create(map.size());
//然后将传入map的值全部赋值给新的BiMap
bimap.putAll(map);
return bimap;
}
添加功能
添加功能有两种,一个是put方法,一个是forcePut方法:
public V put(@Nullable K key, @Nullable V value) {
return this.put(key, value, false);
}
public V forcePut(@Nullable K key, @Nullable V value) {
return this.put(key, value, true);
}
可以看到,这两个方法同时调用了本类的put方法,只不过是这两个方法的第三个参数不同,一个为ture,一个为false,看一下put的源码,看看第三个参数有什么用
private V put(@Nullable K key, @Nullable V value, boolean force) {
//获取传入key的hash值
int keyHash = hash(key);
//获取传入value的hash值
int valueHash = hash(value);
//根据key的值和它的hash值查找是否存在这个节点,seekByKey方法就是遍历了这个keyhash所映射的下标上的链表进行查找。
HashBiMap.BiEntry oldEntryForKey = this.seekByKey(key, keyHash);
if(oldEntryForKey != null && valueHash == oldEntryForKey.valueHash && Objects.equal(value, oldEntryForKey.value)) {
//如果这个key值存在,并且value也相等,则返回这个value
return value;
} else {
//使用seekByValue查找这个value是否存在
HashBiMap.BiEntry oldEntryForValue = this.seekByValue(value, valueHash);
if(oldEntryForValue != null) {
//如果存在,则判断force(第三个参数)是否为false
if(!force) {//Value已经存在了,因此要判断是否允许强制插入
//如果force(第三个参数)为false
//则直接抛出异常
String newEntry1 = String.valueOf(String.valueOf(value));
throw new IllegalArgumentException((new StringBuilder(23 + newEntry1.length())).append("value already present: ").append(newEntry1).toString());
}
//如果force(第三个参数)为true,则删除这个节点,这个方法是双向删除
this.delete(oldEntryForValue);
}
//如果key存在,则删除这个节点
if(oldEntryForKey != null) {
this.delete(oldEntryForKey);
}
//根据key,value,keyHash,valueHash创建一个BiEntry
HashBiMap.BiEntry newEntry = new HashBiMap.BiEntry(key, keyHash, value, valueHash);
//插入这个节点。
this.insert(newEntry);
//插入完成,刷新一下,看看是否需要扩容
this.rehashIfNecessary();
return oldEntryForKey == null?null:oldEntryForKey.value;
}
}
private void insert(HashBiMap.BiEntry<K, V> entry) {
//计算出这个节点在key容器中的下标位置
int keyBucket = entry.keyHash & this.mask;
//使当前节点的keynext指向当前下标位置上
entry.nextInKToVBucket = this.hashTableKToV[keyBucket];
//将当前节点赋值给这个下标位置
this.hashTableKToV[keyBucket] = entry;
//value如key一样
int valueBucket = entry.valueHash & this.mask;
entry.nextInVToKBucket = this.hashTableVToK[valueBucket];
this.hashTableVToK[valueBucket] = entry;
//size加1
++this.size;
++this.modCount;
}
Multimap
支持将 key 映射到多个 value 的方式,而不用定义Map<K, List<V>> 或 Map<K, Set<V>>
这样的形式。实现类包括ArrayListMultimap, HashMultimap, LinkedListMultimap, TreeMultimap...
// 列表实现
ListMultimap<String, Integer> listMultimap = MultimapBuilder.hashKeys().arrayListValues().build();
// 集合实现
SetMultimap<String, Integer> setMultimap = MultimapBuilder.treeKeys().hashSetValues().build();
listMultimap.put("A", 1);
listMultimap.put("A", 2);
listMultimap.put("B", 1);
// {A=[1, 2], B=[1, 2]}
log.debug("{}", listMultimap);
// [1, 2],不存在则返回一个空集合
log.debug("{}", listMultimap.get("A"));
// [1, 2] 移除 key 关联的所有 value
List<Integer> valList = listMultimap.removeAll("A");
// 返回普通 map 的视图,仅支持 remove,不能 put,且会更新原始的 listMultimap
Map<String, Collection<Integer>> map = listMultimap.asMap();
HashMultimap构造器
因为他的构造方法是私有的,所有他会拥有静态方法构造器:
public static <K, V> HashMultimap<K, V> create() {
//new一个HashMultimap,不传入任何值
return new HashMultimap();
}
public static <K, V> HashMultimap<K, V> create(int expectedKeys, int expectedValuesPerKey) {
//new一个HashHultimap,传入两个值,一个是期望key的长度,另一个是期望value的长度
return new HashMultimap(expectedKeys, expectedValuesPerKey);
}
public static <K, V> HashMultimap<K, V> create(Multimap<? extends K, ? extends V> multimap) {
//传入一个Multimap值
return new HashMultimap(multimap);
}
三个构造方法都调用了私有的构造器,私有构造器的源码如下:
private HashMultimap() {
//new一个新的map然后交给父类处理
super(new HashMap());
}
private HashMultimap(int expectedKeys, int expectedValuesPerKey) {
//获取一个expectedKeys 的map然后交给父类处理
super(Maps.newHashMapWithExpectedSize(expectedKeys));
Preconditions.checkArgument(expectedValuesPerKey >= 0);
this.expectedValuesPerKey = expectedValuesPerKey;
}
private HashMultimap(Multimap<? extends K, ? extends V> multimap) {
//获取一个multimap的长度的map交给父类处理
super(Maps.newHashMapWithExpectedSize(multimap.keySet().size()));
this.putAll(multimap);
}
三个私有构造方法都调用了父类的构造方法,接下来看看父类的构造器源码,发现最后的Multimap的数据结构也体现在AbstractMapBasedMultimap这个类中,所以看一下这个类的构造器个变量:
//底层数据结构是一个key为一个Object类,value为一个容器
private transient Map<K, Collection<V>> map;
//Multimap总长度
private transient int totalSize;
protected AbstractMapBasedMultimap(Map<K, Collection<V>> map) {
Preconditions.checkArgument(map.isEmpty());
this.map = map;
}
put方法的实现
public boolean put(@Nullable K key, @Nullable V value) {
//首先在map容器中查看是否有这个key值存在。
Collection collection = (Collection)this.map.get(key);
//如果collection为null,则说明这个key值在map容器中不存在
if(collection == null) {
//根据这个key创建一个容器
collection = this.createCollection(key);
//然后将value放在这个容器中
if(collection.add(value)) {
++this.totalSize;
this.map.put(key, collection);
return true;
} else {
throw new AssertionError("New Collection violated the Collection spec");
}
//如果这个容器存在则直接放入value值
} else if(collection.add(value)) {
++this.totalSize;
return true;
} else {
return false;
}
}
get方法的实现
public Collection<V> get(@Nullable K key) {
//首先在map容器中查看是否有这个key值存在。
Collection collection = (Collection)this.map.get(key);
//如果为null,则为其创建一个容器
if(collection == null) {
collection = this.createCollection(key);
}
//根据本类的wrapCollection方法找到并返回一个集合类
return this.wrapCollection(key, collection);
}
Multiset
Multiset 是一个新的集合类型,可以多次添加相等的元素,既可以看成是无序的列表,也可以看成存储元素和对应数量的键值对映射[E1: cnt1; E2:cnt2]
。常用实现包括 HashMultiset, TreeMultiset, LinkedHashMultiset...
Multiset<String> multiset = HashMultiset.create();
multiset.add("A");
multiset.add("A");
multiset.add("B");
// 输出:[A x 2, B]
log.debug("{}", multiset);
// 元素总数
log.debug("{}", multiset.size());
// 不重复元素个数
log.debug("{}", multiset.elementSet().size());
// 设置元素计数
multiset.setCount("A", 3);
// 获取元素个数
log.debug("{}", multiset.count("A"));
接口源码
public interface Multiset<E> extends Collection<E> {
//返回给定参数元素的个数
int count(@Nullable Object var1);
//向其中添加指定个数的元素
int add(@Nullable E var1, int var2);
//移除相应个数的元素
int remove(@Nullable Object var1, int var2);
//设定某一个元素的重复次数
int setCount(E var1, int var2);
//将符合原有重复个数的元素修改为新的重复次数
boolean setCount(E var1, int var2, int var3);
//将不同的元素放入一个Set中
Set<E> elementSet();
//类似与Map.entrySet 返回Set<Multiset.Entry>。包含的Entry支持使用getElement()和getCount()
Set<Multiset.Entry<E>> entrySet();
boolean equals(@Nullable Object var1);
int hashCode();
String toString();
//返回迭代器
Iterator<E> iterator();
//判断是否存在某个元素
boolean contains(@Nullable Object var1);
//判断是否存在集合中所有元素
boolean containsAll(Collection<?> var1);
//添加元素
boolean add(E var1);
//删除某个元素
boolean remove(@Nullable Object var1);
//删除集合中所有元素
boolean removeAll(Collection<?> var1);
boolean retainAll(Collection<?> var1);
public interface Entry<E> {
E getElement();
int getCount();
boolean equals(Object var1);
int hashCode();
String toString();
}
}
Multiset的接口中方法的实现在AbstractMapBasedMultiset抽象类中,下面针对AbstractMapBasedMultiset类的存储数据结构。add、remove、count和迭代器的实现进行分析
存储数据结构
//可以看到实际存储结构为一个Map,key为存储元素,Count类型存储是key这个元素的个数,看一下Count源码:
private transient Map<E, Count> backingMap;
final class Count implements Serializable {
//记录当前个数
private int value;
//构造方法,为变量赋值
Count(int value) {
this.value = value;
}
//获取当前个数
public int get() {
return this.value;
}
//加上指定个数,先加在返回加完后的值
public int getAndAdd(int delta) {
int result = this.value;
this.value = result + delta;
return result;
}
//加上指定个数,先返回,在进行相加
public int addAndGet(int delta) {
return this.value += delta;
}
//直接设置当前个数
public void set(int newValue) {
this.value = newValue;
}
//先设置新的值在返回这个值大小
public int getAndSet(int newValue) {
int result = this.value;
this.value = newValue;
return result;
}
public int hashCode() {
return this.value;
}
public boolean equals(@Nullable Object obj) {
return obj instanceof Count && ((Count)obj).value == this.value;
}
public String toString() {
return Integer.toString(this.value);
}
}
构造方法
protected AbstractMapBasedMultiset(Map<E, Count> backingMap) {
//存储的Map可以为任意类型的Map
this.backingMap = (Map)Preconditions.checkNotNull(backingMap);
//获取当前Multiset长度
this.size = (long)super.size();
}
add方法
public int add(@Nullable E element, int occurrences) {
//如果想要添加的个数为0
if(occurrences == 0) {
//如果存在则返回这个元素的个数,否则返回0
return this.count(element);
} else {
Preconditions.checkArgument(occurrences > 0, "occurrences cannot be negative: %s", new Object[]{Integer.valueOf(occurrences)});
//根据想要插入的元素在map中找到Count
Count frequency = (Count)this.backingMap.get(element);
int oldCount;
//如果key所对应的Count为null
if(frequency == null) {
//设置原来数据为0
oldCount = 0;
//将这个元素和所对应的Count添加到Map中
this.backingMap.put(element, new Count(occurrences));
} else {
//获取原来个数
oldCount = frequency.get();
//计算出新的个数
long newCount = (long)oldCount + (long)occurrences;
Preconditions.checkArgument(newCount <= 2147483647L, "too many occurrences: %s", new Object[]{Long.valueOf(newCount)});
//为key所对应的Count添加occurrences个
frequency.getAndAdd(occurrences);
}
//将当前的size加上occurrences
this.size += (long)occurrences;
//返回原来数据
return oldCount;
}
}
remove方法
public int remove(@Nullable Object element, int occurrences) {
//如果想要删除0个
if(occurrences == 0) {
//返回当前这个元素的个数,如果不存在容器中返回0
return this.count(element);
} else {
Preconditions.checkArgument(occurrences > 0, "occurrences cannot be negative: %s", new Object[]{Integer.valueOf(occurrences)});
//根据要删除的值作为key获取到他的Count
Count frequency = (Count)this.backingMap.get(element);
//如果对应的Count为null,则返回0
if(frequency == null) {
return 0;
} else {
//获取当前个数
int oldCount = frequency.get();
int numberRemoved;
//如果原来个数大于想要删除的个数
if(oldCount > occurrences) {
numberRemoved = occurrences;
} else {
//如果原来个数小于想要删除的个数
numberRemoved = oldCount;
//直接将这个元素在Map中删除
this.backingMap.remove(element);
}
//设置这个元素对应的Count
frequency.addAndGet(-numberRemoved);
this.size -= (long)numberRemoved;
return oldCount;
}
}
}
Count方法
public int count(@Nullable Object element) {
//以传入的作为key,在map容器中找到相对应的Count
Count frequency = (Count)Maps.safeGet(this.backingMap, element);
//如果这个Count为空,则返回0,否则返回Count中的值
return frequency == null?0:frequency.get();
}
迭代器
public Iterator<E> iterator() {
return new AbstractMapBasedMultiset.MapBasedMultisetIterator();
}
Multiset中有一个实现了Iterator接口的类:
private class MapBasedMultisetIterator implements Iterator<E> {
final Iterator<java.util.Map.Entry<E, Count>> entryIterator;
java.util.Map.Entry<E, Count> currentEntry;
int occurrencesLeft;
boolean canRemove;
MapBasedMultisetIterator() {
//获取当前map容器的迭代器
this.entryIterator = AbstractMapBasedMultiset.this.backingMap.entrySet().iterator();
}
//根据当前迭代器判断是否还有元素
public boolean hasNext() {
return this.occurrencesLeft > 0 || this.entryIterator.hasNext();
}
public E next() {
//如果occurrencesLeft为0,则说明现在处于刚开始,或上一个元素完成
if(this.occurrencesLeft == 0) {
//迭代器向下获取一个元素
this.currentEntry = (java.util.Map.Entry)this.entryIterator.next();
//获取到当前元素的个数
this.occurrencesLeft = ((Count)this.currentEntry.getValue()).get();
}
//因为是获取一个元素,所以减去这一个
--this.occurrencesLeft;
this.canRemove = true;
return this.currentEntry.getKey();
}
public void remove() {
CollectPreconditions.checkRemove(this.canRemove);
int frequency = ((Count)this.currentEntry.getValue()).get();
if(frequency <= 0) {
throw new ConcurrentModificationException();
} else {
if(((Count)this.currentEntry.getValue()).addAndGet(-1) == 0) {
this.entryIterator.remove();
}
AbstractMapBasedMultiset.access$110(AbstractMapBasedMultiset.this);
this.canRemove = false;
}
}
}
这个迭代器的好处是,存储多个相同的值,不会占用多个地方,只会占用1个位置。