Java Hashtable类源码解析-低调大师

Java Hashtable类源码解析

2018-08-15 542

老生常谈的问题——Hashtable和HashMap有什么区别

大家一般都能说出几条，比如Hashtable是线程安全的，不支持null作为key和value值等等。那么，要仔细了解这个问题还是直接从Hashtable的源码入手。

先列一下我找到的区别：

继承类不同，Hashtable继承的是Dictionary这是一个废弃类，而HashMap继承的是AbstractMap
产生时间不同，Hashtable自JDK1.0版本就有了，而HashMap是JDK1.2才加入的，同时Hashtable可能因为历史原因并不是我们习惯的驼峰法命名的
Hashtable比HashMap多提供了elments()方法用于返回此Hashtable中的value的枚举
Hashtable既不支持null key也不支持null value
Hashtable的默认大小是11，扩大的逻辑是*2+1，对于给定大小不会做扩展。而HashMap是16，扩大时*2，初始大小会转换成恰好大于等于的2的指数次幂
Hashtable中的遍历操作是从高位开始的，而HashMap是从低位开始
Hashtable处理冲突元素时插入到链表头部，而HashMap是插入到链表尾部
Hashtable的hashcode方法计算所有entry的hashcode总和，HashMap没有这样的方法，同时HashMap在计算hash值时会用高位右移16位与低位异或来打散散列值，避免位与操作造成冲突过多
Hashtable每一次定位都要做一次完整的除法取余数，而HashMap使用的是与数组大小-1的位与计算，效率高很多
Hashtable的方法都加上了synchronized是线程安全的方法，而HashMap不是，所以单线程时前者额外开销很大。JDK8以后Hashtable也用了modCount来保证在遍历过程中其他线程修改对象的fast-fail机制。但是，即使是多线程环境下，依然应该优先选择对HashMap进行一些特殊处理而不是用Hashtable，因为所有方法都加上synchronized的程序并发性很差。实际上就我个人经验而言，在一些特定的具体情况下，比如大规模写入key值连续数据（出自今年的第四届阿里中间件性能挑战赛复赛题），链表法解决冲突性能可能不如开放地址法，即使加上了红黑树。所以说对于一些对极致压榨性能的情况下，适当的可以抛弃一些通用的集合而尝试自由发挥造轮子。

首先从最上方的注释中可以看到Hashtable自JDK1.0版本就有了，而HashMap是JDK1.2才加入的。观察一下类的声明，我们可以看到他们继承的类也是不同的，Hashtable继承的是Dictionary, Dictionary这个类从注释上写着已经是obsolete被废弃了，所以连带Hashtable也基本不用了 。 Hashtable 也有元素个数，数组大小，负载因子这些属性，不用元素个数用的是 count 不是 size 。也是使用链表法来解决冲突。

public class Hashtable<K,V>
    extends Dictionary<K,V>
    implements Map<K,V>, Cloneable, java.io.Serializable
public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable

构造函数可以看出默认大小是 11，同时初始大小给定多少初始数组就多大，不会做扩展到2的指数次幂这样的操作。 threshold=initialCapacity*loadFactor 这点和 HashMap 相同。

    public Hashtable(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal Load: "+loadFactor);

        if (initialCapacity==0)
            initialCapacity = 1;
        this.loadFactor = loadFactor;
        table = new Entry<?,?>[initialCapacity];
        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    }

    public Hashtable() {
        this(11, 0.75f);
    }

contains 这个方法是从表尾开始向前搜索的，同时也没有使用 ==来比较

    public synchronized boolean contains(Object value) {
        if (value == null) {
            throw new NullPointerException();
        }

        Entry<?,?> tab[] = table;
        for (int i = tab.length ; i-- > 0 ;) {
            for (Entry<?,?> e = tab[i] ; e != null ; e = e.next) {
                if (e.value.equals(value)) {
                    return true;
                }
            }
        }
        return false;
    }

从 containsKey 可以看出， Hashtable的index计算逻辑是使用key.hashCode()的后31位然后除以tab.length 取余数。 HashMap 的那种按位与的操作仅当操作数低位全是 1 时才等价为取余操作，也就是 2 的指数次幂 -1 才可成立，这样做计算速度比除法快很多，不过冲突数量会增加，所以加入了一些打散的设计比如hashCode高位与低位异或。

    public synchronized boolean containsKey(Object key) {
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();
        int index = (hash & 0x7FFFFFFF) % tab.length;
        for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
            if ((e.hash == hash) && e.key.equals(key)) {
                return true;
            }
        }
        return false;
    }

扩展方法rehash的 扩大方式是旧数组大小*2+1 ，而HashMap是*2，要重新计算每一个的index所以效率低，同时冲突时将 后面的元素插入到前面元素的前一位 ，所以会改变顺序

    protected void rehash() {
        int oldCapacity = table.length;
        Entry<?,?>[] oldMap = table;

        // overflow-conscious code
        int newCapacity = (oldCapacity << 1) + 1;//新大小=旧大小*2+1
        if (newCapacity - MAX_ARRAY_SIZE > 0) {
            if (oldCapacity == MAX_ARRAY_SIZE)
                // Keep running with MAX_ARRAY_SIZE buckets
                return;
            newCapacity = MAX_ARRAY_SIZE;
        }
        Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];//创建一个新的数组

        modCount++;
        threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
        table = newMap;

        for (int i = oldCapacity ; i-- > 0 ;) {
            for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
                Entry<K,V> e = old;
                old = old.next;

                int index = (e.hash & 0x7FFFFFFF) % newCapacity;//重新计算每一个元素的index
                e.next = (Entry<K,V>)newMap[index];//前后元素有冲突时，后面的元素插入到前面元素的前面
                newMap[index] = e;
            }
        }
    }

对于插入结点同样要先检查是否存在key值相同的点，存在则不插入，然后检查是否需要扩展数组，插入时如果发生冲突，也是将要 插入的元素放在链表的首位 ，而putVal方法是放入尾部的。同时，可以看到Hashtable是 不支持null作为key或value值的

    public synchronized V put(K key, V value) {
        // Make sure the value is not null
        if (value == null) {//value为null直接报错
            throw new NullPointerException();
        }

        // Makes sure the key is not already in the hashtable.
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();//若key为null这里会报错
        int index = (hash & 0x7FFFFFFF) % tab.length;
        @SuppressWarnings("unchecked")
        Entry<K,V> entry = (Entry<K,V>)tab[index];
        for(; entry != null ; entry = entry.next) {
            if ((entry.hash == hash) && entry.key.equals(key)) {
                V old = entry.value;
                entry.value = value;
                return old;
            }
        }

        addEntry(hash, key, value, index);
        return null;
    }
    private void addEntry(int hash, K key, V value, int index) {
        modCount++;

        Entry<?,?> tab[] = table;
        if (count >= threshold) {
            // Rehash the table if the threshold is exceeded
            rehash();

            tab = table;
            hash = key.hashCode();
            index = (hash & 0x7FFFFFFF) % tab.length;
        }

        // Creates the new entry.
        @SuppressWarnings("unchecked")
        Entry<K,V> e = (Entry<K,V>) tab[index];
        tab[index] = new Entry<>(hash, key, value, e);
        count++;
    }

Hashtable的 hashcode方法计算所有entry的hash值总和

public synchronized int hashCode() {
        int h = 0;
        if (count == 0 || loadFactor < 0)
            return h;  // Returns zero

        loadFactor = -loadFactor;  // Mark hashCode computation in progress
        Entry<?,?>[] tab = table;
        for (Entry<?,?> entry : tab) {
            while (entry != null) {
                h += entry.hashCode();
                entry = entry.next;
            }
        }

        loadFactor = -loadFactor;  // Mark hashCode computation complete

        return h;
    }

elements 这个方法是Hashtable多出来的， 返回所有value值的枚举

    public synchronized Enumeration<V> elements() {
        return this.<V>getEnumeration(VALUES);
    }

我们可以注意到，Hashtable的 方法都加上了synchronized，他们是线程安全的，但是对于本身是线程安全的情况就会大幅度影响性能，JDK8开始引入modCount来作为fast-fail机制，防止其他线程的非synchronzied方法对Hashtable进行修改。

微信关注我们

原文链接：https://yq.aliyun.com/articles/625884

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

C++与C#相比，哪个更适合开发大型游戏？

我觉得这个问题倒过来回答比较合适，先解答一下目前主流的大型游戏，都是使用什么语言开发的。再说说哪种语言更适合开发大型游戏。首先，先说下，大部分游戏，甚至是应用，都极少只使用一种语言开发的。主流游戏的开发语言 LOL LOL登陆后的界面，是使用html编写的，主界面的动画效果是html+flash动画处理的。重点来了，游戏所使用的引擎，是拳头公司自己开发的3D引擎，是基于C++开发的。 GAT5 这里就说GAT5吧，GAT5采用的是RAGE引擎，这个引擎适用于PC、PS3、PS4、Wii、Xbox One和Xbox 360平台。据我所知，应该是用C++写的…… 王者荣耀王者荣耀是基于Unity3d（.NET C#）引擎开发的跨平台游戏，具网友拆包发现，王者荣耀使用的开发语言为C#。绝地求生据我所知，绝地求生（端游），使用的是虚幻4引擎，用的是C++。游戏开发语言如果一家游戏公司要开发自己的游戏引擎，为了效率，大部分都会选择C++作为开发语言。但可以开发游戏的语言非常多，主要包括C/C++，汇编语言，着色器语言、脚本语言、高效的开发语言C#或Java。可以说开发游戏，C/C+...

2018-08-16

586

Java 调用Jenkins API远程触发部署

第一步：引入相关的包 // Jenkins-client compile group: 'com.offbytwo.jenkins', name: 'jenkins-client', version: '0.3.6' 第二步：写代码 JenkinsServer jenkins = new JenkinsServer(new URI("此处是Jenkins访问路径，eg：http://localhost:8088/"), "此处是用户名，eg: zhangsan", "此处是用户密码：eg: 110110"); // 判断jenkins是否running if(jenkins.isRunning()){ // 获取jenkins构建脚本 String jobXml = jenkins.getJobXml("jobName"); // 修改构建脚本 jenkins.updateJob("jobName",newJobXml); // 构建对应的job jenkins.getJob("jobName").build(); // 获取html格式日志 jenkins.getJob("jobNa...

2018-08-16

580

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Oracle

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。