Java?HashMap詳解及實(shí)現(xiàn)原理

更新時間：2023年05月16日 08:46:08 作者：蜀山劍客李沐白

Java?HashMap是Java集合框架中最常用的實(shí)現(xiàn)Map接口的數(shù)據(jù)結(jié)構(gòu)，它使用哈希表實(shí)現(xiàn)，允許null作為鍵和值，可以存儲不同類型的鍵值對，在Java中，HashMap被廣泛應(yīng)用于各種場景，如緩存、數(shù)據(jù)庫連接池、路由器等，文中有詳細(xì)的代碼示例,需要的朋友可以參考下

一、什么是Java HashMap

Java HashMap是Java集合框架中最常用的實(shí)現(xiàn)Map接口的數(shù)據(jù)結(jié)構(gòu)，它使用哈希表實(shí)現(xiàn)，允許null作為鍵和值，可以存儲不同類型的鍵值對。HashMap提供了高效的存取方法，并且是非線程安全的。在Java中，HashMap被廣泛應(yīng)用于各種場景，如緩存、數(shù)據(jù)庫連接池、路由器等。

二、Java HashMap的實(shí)現(xiàn)原理

HashMap使用哈希表(Hash Table)實(shí)現(xiàn)，哈希表是一種以鍵值對(key-value)的形式進(jìn)行存儲和快速查找的數(shù)據(jù)結(jié)構(gòu)。HashMap內(nèi)部維護(hù)了一個數(shù)組，每個數(shù)組元素都是一個鏈表節(jié)點(diǎn)，每個節(jié)點(diǎn)包含一個鍵值對，以及指向下一個節(jié)點(diǎn)的指針。當(dāng)需要查找或插入一個元素時，HashMap首先計(jì)算該元素的哈希值，根據(jù)哈希值確定它在數(shù)組中的位置，然后在對應(yīng)的鏈表上進(jìn)行查找或插入操作。

1. 哈希值的計(jì)算方法

首先，HashMap會調(diào)用鍵對象的hashCode()方法，獲取到該對象的哈希碼。哈希碼是一個int類型的整數(shù)，用于表示該對象的標(biāo)識號。但是，由于哈希碼的范圍很大，因此通常需要對它進(jìn)行下一步處理，轉(zhuǎn)換成一個比較小的數(shù)值，以便存儲到數(shù)組中。這樣，就用到了哈希函數(shù)(Hash Function)，哈希函數(shù)用于將大范圍的哈希碼映射到較小的數(shù)組索引范圍內(nèi)。

HashMap的哈希函數(shù)有多種實(shí)現(xiàn)方式，其中一種常用的方法是將哈希碼與數(shù)組長度取模后的余數(shù)作為數(shù)組下標(biāo)，即：

index = hashCode % array.length

其中，array為HashMap內(nèi)部維護(hù)的數(shù)組，hashCode為鍵的哈希碼，index為鍵在數(shù)組中的下標(biāo)。這個方法的優(yōu)點(diǎn)是簡單、快速，但缺點(diǎn)也很明顯：當(dāng)哈希碼分布不均衡時，容易出現(xiàn)哈希沖突(Haah Collision)，即不同的鍵對象具有相同的哈希碼，導(dǎo)致它們被映射到同一個數(shù)組位置上，形成一個鏈表。

2. 解決哈希沖突的方法

為了解決哈希沖突，HashMap使用鏈表法(Chaining)來處理。鏈表法是將哈希沖突的元素以鏈表的形式組織起來，所有哈希值相同的元素作為同一個鏈表的節(jié)點(diǎn)，并按照插入順序排列。

鏈表法的實(shí)現(xiàn)非常簡單，每個數(shù)組元素都是一個鏈表節(jié)點(diǎn)，如果該元素已經(jīng)存在鏈表中，則將新元素插入到鏈表的末尾，否則創(chuàng)建一個新的節(jié)點(diǎn)，并將其插入到鏈表頭部。這種方式可以在O(1)的時間內(nèi)進(jìn)行查找、插入和刪除等操作。

當(dāng)鏈表長度變長時，查找、插入和刪除操作的效率會降低。為了解決這個效率問題，JDK1.8引入了紅黑樹(Red-Black Tree)的使用場景，當(dāng)鏈表長度超過閾值(默認(rèn)為8)時，將鏈表轉(zhuǎn)換為紅黑樹，以提高效率。

3. 數(shù)組擴(kuò)容

數(shù)組擴(kuò)容是HashMap內(nèi)部的一個重要操作，當(dāng)調(diào)用put()方法時，若當(dāng)前的元素?cái)?shù)量已經(jīng)達(dá)到了擴(kuò)容閾值，則需要進(jìn)行數(shù)組擴(kuò)容操作。其擴(kuò)容機(jī)制如下：

首先，創(chuàng)建一個新的空數(shù)組，大小為原數(shù)組的兩倍；然后遍歷原數(shù)組中的每個元素，重新計(jì)算它們在新數(shù)組中的位置，然后將這些元素放到新數(shù)組中相應(yīng)的位置上；最后，再將新數(shù)組設(shè)置為HashMap內(nèi)部的數(shù)組。因此，在擴(kuò)容過程中，需要重新計(jì)算哈希值，重新映射數(shù)組下標(biāo)，并將元素復(fù)制到新數(shù)組，這個過程是很費(fèi)時間和空間的。因此，為了減少擴(kuò)容的次數(shù)，一般情況下，將HashMap的初始化容量設(shè)置為能夠存放預(yù)計(jì)元素?cái)?shù)量的1.5倍。

4. 加載因子

HashMap內(nèi)部還維護(hù)著一個加載因子(load factor)屬性，默認(rèn)為0.75。它表示當(dāng)元素?cái)?shù)量與數(shù)組長度的比值超過了這個閾值時，就會進(jìn)行擴(kuò)容操作，以便保持哈希表的性能。一般來說，較小的負(fù)載因子會增加哈希表的存儲空間，但會減少哈希沖突的發(fā)生機(jī)率，提高查詢效率；而較大的負(fù)載因子則會減少存儲空間，但會增加哈希沖突的概率，降低查詢效率。因此，在決定負(fù)載因子的大小時，需要根據(jù)應(yīng)用場景、數(shù)據(jù)量和時間復(fù)雜度等因素進(jìn)行合理的取舍。

三、Java HashMap的常用方法

HashMap提供了一些常見的操作方法，如put()、get()、remove()、size()等。下面對這些方法進(jìn)行簡要介紹：

put(Object key, Object value)

將指定的鍵值對插入到HashMap中，如果該鍵已經(jīng)存在，則會用新的值替換已有的值。插入成功返回null，否則返回被替換的舊值。

HashMap<String, Integer> map = new HashMap<>();
map.put("tom", 90); // 插入鍵值對
map.put("jerry", 85);
int oldScore = map.put("tom", 95); // 替換鍵值對
System.out.println(map.get("tom")); // 輸出95

get(Object key)

返回與指定鍵相關(guān)聯(lián)的值，如果該鍵不存在，則返回null。

HashMap<String, Integer> map = new HashMap<>();
map.put("tom", 90);
map.put("jerry", 85);
int score = map.get("tom");
System.out.println(score); // 輸出90

remove(Object key)

刪除HashMap中與指定鍵相關(guān)聯(lián)的值，并返回被刪除的值。

HashMap<String, Integer> map = new HashMap<>();
map.put("tom", 90);
map.put("jerry", 85);
int score = map.remove("tom");
System.out.println(score); // 輸出90

size()

返回HashMap中鍵值對的數(shù)量。

HashMap<String, Integer> map = new HashMap<>();
map.put("tom", 90);
map.put("jerry", 85);
int size = map.size();
System.out.println(size); // 輸出2

clear()

刪除HashMap中所有鍵值對。

HashMap<String, Integer> map = new HashMap<>();
map.put("tom", 90);
map.put("jerry", 85);
map.clear();
System.out.println(map.size()); // 輸出0

四、Java HashMap的線程安全性

在多線程環(huán)境下，由于HashMap是非線程安全的數(shù)據(jù)結(jié)構(gòu)，會產(chǎn)生多線程訪問帶來的并發(fā)問題，因此在多線程環(huán)境下需要特別注意HashMap的線程安全性。

HashMap的線程安全問題

HashMap是一種非線程安全（Not Thread-Safe）的數(shù)據(jù)結(jié)構(gòu)，因此，在多線程環(huán)境下使用它可能會導(dǎo)致多種并發(fā)問題，主要包括以下幾個方面：

（1）覆蓋和丟失：如果多個線程同時對同一個位置進(jìn)行寫入操作，最終只有一個線程的結(jié)果能夠生效，而其他的操作將被覆蓋或丟失。

（2）讀取過期數(shù)據(jù)：在HashMap中，讀取操作可以在讀取和修改操作之間進(jìn)行，也就是說，多個線程可以同時讀取同一個數(shù)據(jù)。然而，如果一個線程在讀取一個鍵的值時，另一個線程正在修改它，那么讀操作可能會讀取到過期的數(shù)據(jù)，從而導(dǎo)致程序出現(xiàn)問題。

（3）死鎖和饑餓：由于HashMap使用數(shù)組和鏈表（或紅黑樹）的結(jié)合實(shí)現(xiàn)，因此在多線程環(huán)境下，可能會出現(xiàn)死鎖和饑餓的情況，降低程序性能。

HashMap的線程安全解決方案

為了解決HashMap的線程安全問題，Java提供了多種解決方案，以下是幾種常用的方式：

（1）使用ConcurrentHashMap

ConcurrentHashMap是Java 5中提供的一種線程安全的Map實(shí)現(xiàn)，它采用了鎖分段技術(shù)，在每個段（Segment）中都使用了一個獨(dú)立的鎖，以避免多個線程訪問同一段的問題，從而保證了并發(fā)性能和線程安全性。ConcurrentHashMap實(shí)現(xiàn)了Java中的ConcurrentMap接口，并提供了多個線程安全的方法，如putIfAbsent、remove、replace等。如果需要在多線程環(huán)境下使用Map，推薦使用ConcurrentHashMap。

（2）使用Collections.synchronizedMap()

Collections.synchronizedMap()是Java提供的一種將非線程安全的Map對象轉(zhuǎn)換為線程安全的Map對象的方法。它實(shí)際上是對Map對象的每個方法都添加了synchronized關(guān)鍵字，從而保證了并發(fā)性能和線程安全性。使用Collections.synchronizedMap()創(chuàng)建線程安全的Map對象的代碼如下：

Map<K, V> map = Collections.synchronizedMap(new HashMap<>());

這種方式適合于訪問頻率較低或者對線程安全性要求不高的場景。

（3）使用線程安全的并發(fā)集合

除了ConcurrentHashMap和synchronizedMap()外，Java還提供了其他多種線程安全的集合實(shí)現(xiàn)和映射實(shí)現(xiàn)，如CopyOnWriteArrayList、ConcurrentSkipListMap等。這些集合和映射實(shí)現(xiàn)都具有優(yōu)秀的性能和線程安全性，可以根據(jù)實(shí)際需求選擇使用。

HashMap的并發(fā)測試

為了驗(yàn)證HashMap的線程安全問題，可以編寫并發(fā)測試程序來模擬多線程訪問HashMap時可能出現(xiàn)的問題。以下是一段示例代碼：

Map<String, Integer> map = new HashMap<>();
for (int i = 0; i < 1000; i++) {
    final int index = i;
    new Thread(() -> map.put("key-" + index, index)).start();
}
for (int i = 0; i < 1000; i++) {
    final int index = i;
    new Thread(() -> System.out.println(map.get("key-" + index))).start();
}

該程序首先創(chuàng)建了1000個線程并發(fā)往HashMap中添加鍵值對，然后又創(chuàng)建了1000個線程并發(fā)讀取HashMap中的鍵值對。由于HashMap是非線程安全的數(shù)據(jù)結(jié)構(gòu)，可能會產(chǎn)生數(shù)據(jù)丟失、讀取過期數(shù)據(jù)等問題，因此，執(zhí)行上述代碼，有可能會輸出null或錯誤的結(jié)果。

五、Java HashMap使用注意事項(xiàng)

鍵必須實(shí)現(xiàn)hashCode()方法和equals()方法

在使用HashMap時，鍵必須實(shí)現(xiàn)hashCode()方法和equals()方法，以便用于哈希表中的查找操作。hashCode()方法用于獲取對象的哈希碼，equals()方法用于判斷兩個對象是否相等。如果鍵沒有實(shí)現(xiàn)這兩個方法，則會出現(xiàn)查詢異常和哈希沖突等問題。

值可以為null在HashMap中，值可以為null，這意味著一個鍵可以映射到空值。但需要注意的是，如果多個鍵映射到null，則它們在HashMap中實(shí)際上是相等的，因?yàn)樗鼈兌紩挥成涞酵粋€位置上。
迭代器操作時需要注意

在使用HashMap的迭代器遍歷鍵值對時，需要注意當(dāng)在遍歷過程中插入或刪除元素時，可能會導(dǎo)致ConcurrentModificationException異常的發(fā)生。這是因?yàn)樵诒闅v過程中，遍歷器會對HashMap的修改操作進(jìn)行快照，并在遍歷結(jié)束后進(jìn)行檢查，如果與快照不一致，則拋出異常。為了避免這種情況的發(fā)生，可以使用Iterator接口提供的remove()方法來刪除元素，而不是直接調(diào)用HashMap的remove()方法。

初始化容量和加載因子的設(shè)置

在創(chuàng)建HashMap對象時，需要根據(jù)實(shí)際業(yè)務(wù)場景合理地設(shè)置初始化容量和加載因子，以便提高HashMap的性能。如果預(yù)計(jì)插入的元素?cái)?shù)量很大，那么初始化容量應(yīng)該足夠大，以減少數(shù)組擴(kuò)容的次數(shù)；同時，可以將加載因子設(shè)置為較小的值，以提高查詢效率。但是，需要注意不要將初始化容量設(shè)置過大或加載因子設(shè)置過小，否則會浪費(fèi)內(nèi)存資源或增加哈希沖突的概率，影響性能。

避免哈希沖突

哈希沖突是指不同的鍵對象具有相同的哈希碼，導(dǎo)致它們被映射到同一個數(shù)組位置上，形成一個鏈表。當(dāng)鏈表長度變長時，查詢效率會降低。為了避免哈希沖突，可以在設(shè)計(jì)鍵對象時，盡可能地使其哈希值范圍分布均勻，并且盡可能減少哈希沖突的發(fā)生。例如，在字符串類型的鍵中，可以采用漢明距離等算法來計(jì)算鍵的哈希值，并增加隨機(jī)數(shù)來打亂散列結(jié)果，從而減少哈希沖突的發(fā)生。

hashCode()方法和equals()方法的重寫

在使用HashMap時，為了保證其正確性和性能，通常需要重寫鍵對象的hashCode()方法和equals()方法。hashCode()方法用于計(jì)算鍵對象的哈希碼，而equals()方法用于比較兩個對象是否相等。如果兩個鍵對象的哈希碼相同，但equals()方法返回false，則會導(dǎo)致哈希沖突的發(fā)生。因此，在重寫hashCode()方法時，需要保證對于相等的對象其哈希碼相等；而在重寫equals()方法時，需要保證對于相等的對象其equals()方法返回true。

例如，在自定義類型的鍵中，可以將鍵的各個字段的哈希碼按照不同的權(quán)重組合起來，生成一個唯一的哈希值。同時，重寫equals()方法時需要判斷兩個對象的各個字段是否相等，以確保它們是相等的。

class Person {
    private String name;
    private int age;

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    @Override
    public int hashCode() {
        return Objects.hash(name, age);
    }

    @Override
    public boolean equals(Object obj) {
        if (this == obj)
            return true;
        if (obj == null || getClass() != obj.getClass())
            return false;
        Person person = (Person) obj;
        return age == person.age && Objects.equals(name, person.name);
    }
}

LinkedHashMap的使用

LinkedHashMap是Java集合框架中實(shí)現(xiàn)了Map接口的有序哈希表，它具有HashMap的所有特性，并且支持按照插入順序或者訪問順序遍歷鍵值對。在使用LinkedHashMap時，可以通過構(gòu)造函數(shù)來指定其遍歷順序，并且可以通過覆蓋removeEldestEntry()方法來實(shí)現(xiàn)緩存淘汰策略。

LinkedHashMap<String, Integer> map = new LinkedHashMap<>(16, 0.75f, true);
map.put("tom", 90);
map.put("jerry", 85);
map.put("bob", 88);
System.out.println(map.get("tom")); // 輸出90
map.get("jerry");
for (Map.Entry<String, Integer> entry: map.entrySet()) {
    System.out.println(entry.getKey() + " : " + entry.getValue());
}

在上面這個例子中，創(chuàng)建了一個容量為16、負(fù)載因子為0.75、按照訪問順序排序的LinkedHashMap對象。然后依次插入三個鍵值對，其中“tom”對應(yīng)的值為90。接著，訪問“tom”鍵，并通過遍歷LinkedHashMap來輸出所有的鍵值對，可以看到“tom”的位置已經(jīng)發(fā)生

以上就是Java HashMap詳解及實(shí)現(xiàn)原理的詳細(xì)內(nèi)容，更多關(guān)于Java HashMap的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: