【源码解析】JDK1.8——HashMap

HashMap源码解析

    public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
  • 实现Cloneable接口:重写clone()方法,实现浅拷贝
  • 实现Serializable接口:HashMap对象可以被序列化

    public abstract class AbstractMap<K,V> implements Map<K,V>
    

注:在语法层面继承接口Map是多余的,仅仅起到一个文档作用

AbstractMap抽象类

如何实现不可变Map

只需继承AbstractMap,然后实现其entrySet方法,这个方法返回的set不支持add与remove,同时这个set的迭代器(iterator)不支持remove操作即可。

如何实现可变Map

首先继承AbstractMap,然后重写(override)AbstractMap的put方法,同时实现entrySet所返回set的迭代器的remove方法即可

设计理念

HashMap基于哈希表实现

哈希表:叫做关联数组,通用的数据结构。其概念key经过hash函数作用后得到一个槽(buckets或slots)的索引(index),槽中保存着我们想要获取的值

注意:哈希表不同的key经过同一hash函数后可能产生相同的索引(冲突)

HashMap如何避免冲突

HashMap特性

  • 线程非安全,允许key与value都为null值,HashTable与之相反
  • 无序
  • put、get操作的时间复杂度为O(1)
  • 遍历其集合视角的时间复杂度与其容量(capacity)和现有元素的大小(entry)成正比
  • 多个线程同时对一hashmap的集合试图做迭代时有结构的上改变(增加、删除),会报ConcurrentModificationException,专业术语叫fail-fast
  • Map map = Collections.synchronizedMap(new HashMap(…));得到线程安全的Map

源码

构造函数

//容量必须为2的指数倍(默认为16) (??参考HashMap中哈希函数的设计原理??)
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
static final int MAXIMUM_CAPACITY = 1 << 30;
//默认3/4。过高的因子会降低存储空间但是查找新增方法的时间会增加。
static final float DEFAULT_LOAD_FACTOR = 0.75f;

public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    //容量有最大值
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    //平衡因子和容量因子都有默认值
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}
public HashMap(int initialCapacity)

数据结构

在JDK1.6中采用位桶+链表的形式,而JDK1.8采用位桶+链表+红黑树实现,当链表长度超过阈值(8)时,将链表转换为红黑树。节省了查找时间

单向链表

static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;
        //hash值、键、值、下一个节点
        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }
        //判断两个节点是否相等
        public final boolean equals(Object o) {
            //与自身比较返回true
            if (o == this)
                return true; 
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

红黑树

static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
   TreeNode<K,V> parent;  // 父节点
   TreeNode<K,V> left; //左树节点
   TreeNode<K,V> right; //右树节点
   TreeNode<K,V> prev;    // needed to unlink next upon deletion
   boolean red; //颜色属性 red=true blank=false

   TreeNode(int hash, K key, V val, Node<K,V> next) {
       super(hash, key, val, next);
   }
   //返回当前节点的根节点
   final TreeNode<K,V> root() {
       for (TreeNode<K,V> r = this, p;;) {
           if ((p = r.parent) == null)
               return r;
           r = p;
       }
   }

   static <K,V> void moveRootToFront(Node<K,V>[] tab, TreeNode<K,V> root) {
       int n;
       if (root != null && tab != null && (n = tab.length) > 0) {
           int index = (n - 1) & root.hash;
           TreeNode<K,V> first = (TreeNode<K,V>)tab[index];
           if (root != first) {
               Node<K,V> rn;
               tab[index] = root;
               TreeNode<K,V> rp = root.prev;
               if ((rn = root.next) != null)
                   ((TreeNode<K,V>)rn).prev = rp;
               if (rp != null)
                   rp.next = rn;
               if (first != null)
                   first.prev = root;
               root.next = first;
               root.prev = null;
           }
           assert checkInvariants(root);
       }
   }

位桶

transient Node<K,V>[] table;

HashMap的具体实现

有一个每一元素都是链表的数组,添加key-value时,计算key-value的hash值,确定插入数组位置,可能存在每个hash值得元素被放在同一数组位置,添加到同一hash值的元素的后面。

当链表长度太长时,链表就转换为红黑树。增大转换效率

get

 final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    //hash & (length-1)得到对象的保存位  
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            //如果第一个节点是TreeNode,说明采用的是数组+红黑树结构处理冲突  
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            //链表结构处理 (放在相同哈希值的元素之后位置)
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

putval

 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    //如果tab为空或长度为0,则分配内存resize()  
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    //(n - 1) & hash找到put位置,如果为空,则直接put  
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        //第一节节点hash值同,且key值与插入key相同  
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode) //红黑树处理冲突  
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else { //链表处理冲突  
            for (int binCount = 0; ; ++binCount) {
                //p第一次指向表头,以后依次后移  
                if ((e = p.next) == null) {
                    //e为空,表示已到表尾也没有找到key值相同节点,则新建节点  
                    p.next = newNode(hash, key, value, null);
                    //新增节点后如果节点个数到达阈值,则将链表转换为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                 //更新hash值和key值均相同的节点Value值  
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

HashMap线程不安全

在多线程环境下,假设有容器map,其存储的情况如下图所示(淡蓝色为已有数据)。

此时的map已经达到了扩容阈值12(16 * 0.75 = 12),而此时线程A与线程B同时对map容器进行插入操作,那么都需要扩容。此时可能出现的情况如下:线程A与线程B都进行了扩容,此时便有两个新的table,那么再赋值给原先的table变量时,便会出现其中一个newTable会被覆盖,假如线程B扩容的newTable覆盖了线程A扩容的newTable,并且是在A已经执行了插入操作之后,那么就会出现线程A的插入失效问题,也即是如下图中的两个table只能有一个会最后存在,而其中一个插入的值会被舍弃的问题。

这便是HashMap的线程不安全性,当然这只是其中的一点。而要消除这种隐患,则可以加锁或使用HashTable和ConcurrentHashMap这样的线程安全类,但是HashTable不被建议使用,推荐使用ConcurrentHashMap容器

参考

http://blog.csdn.net/u010498696/article/details/45888613