Version: Next

ThreadLocal

线程私有的存储数据结构，底层是 Map

Thread、ThreadLocal、ThreadLocalMap、Entry

set 方法

/**
* Sets the current thread's copy of this thread-local variable
* to the specified value.  Most subclasses will have no need to
* override this method, relying solely on the {@link #initialValue}
* method to set the values of thread-locals.
*
* @param value the value to be stored in the current thread's copy of
*        this thread-local.
*/
public void set(T value) {
    Thread t = Thread.currentThread(); // 获取当前线程
    ThreadLocalMap map = getMap(t); // 获取当前线程对应的 Map
    if (map != null)
        map.set(this, value);
    else
        createMap(t, value);
}

Set() 方法中使用了 getMap(thread) 方法获取线程对应的 Map，再看 getMap(thread) 方法的源码

getMap 方法

/**
* Get the map associated with a ThreadLocal. Overridden in
* InheritableThreadLocal.
*
* @param  t the current thread
* @return the map
*/
ThreadLocalMap getMap(Thread t) {
    return t.threadLocals;
}

显然，threadLocals 是线程类 Thread 的一个成员变量

Thread 类中的 threadLocals

/* ThreadLocal values pertaining to this thread. This map is maintained
* by the ThreadLocal class. */
ThreadLocal.ThreadLocalMap threadLocals = null;

类型是 ThreadLocal.ThreadLocalMap，其实 ThreadLocal 中的一个子类

为什么 ThreadLocal 可以解决线程安全问题

到目前为止，已经可以看到，ThreadLocal 是每个线程都有一个自己的 Map 来存储数据，存储的地方是分开的

再看 ThreadLocalMap 的源码，发现下面有个子类 Entry 就是 ThreadLocalMap 中存储的实体

ThreadLocalMap

static class ThreadLocalMap {

    /**
 * The entries in this hash map extend WeakReference, using
 * its main ref field as the key (which is always a
 * ThreadLocal object).  Note that null keys (i.e. entry.get()
 * == null) mean that the key is no longer referenced, so the
 * entry can be expunged from table.  Such entries are referred to
 * as "stale entries" in the code that follows.
 */
    static class Entry extends WeakReference<ThreadLocal<?>> {
        /** The value associated with this ThreadLocal. */
        Object value;

        Entry(ThreadLocal<?> k, Object v) {
            super(k);
            value = v;
        }
    }

    /**
         * The initial capacity -- MUST be a power of two.
         */
    private static final int INITIAL_CAPACITY = 16;

    /**
         * The table, resized as necessary.
         * table.length MUST always be a power of two.
         */
    private Entry[] table;

    /**
         * The number of entries in the table.
         */
    private int size = 0;

    /**
         * The next size value at which to resize.
         */
    private int threshold; // Default to 0

    /**
         * Set the resize threshold to maintain at worst a 2/3 load factor.
         */
    private void setThreshold(int len) {
        threshold = len * 2 / 3;
    }
    
    // .....
}

Entry 继承了 WeakReference<ThreadLocal<?>> 弱引用

强引用与弱引用

弱引用与强引用的区别
强引用
引用 -> 对象
在 GC 时不会被回收，只有当 引用 -> null，根据可达性分析，落空的对象才会被 GC 回收
弱引用
引用 -> WeakReference弱引用对象 ……> 真实对象
一旦 GC，则 WeakReference弱引用对象 到 真实对象 的引用就消失了，真实对象被回收，而 引用 到 WeakReference 的引用依然保持
即 引用 -> WeakReference弱引用 -> null
ThreadLocal 使用弱引用主要是为了让 ThreadLocal 生命周期与 Thread 生命周期解耦

ThreadLocal 内存结构图

虚线为弱引用、实线为强引用
Entry 的 Key 为弱引用，指向 ThreadLocal 对象
Entry 的 Value 为强引用，指向堆内存中的数据

每个 Thread 线程内部有一个 Map：ThreadLocalMap
Map 里面存储 Entry 实体，是一种 key-value 结构，其中 Key 为 ThreadLocal 对象；Value 是线程变量副本
Thread 内部的 Map 是由 ThreadLocal 维护的，由 ThreadLocal 负责向 Map 获取和设置线程的变量值
对于不同的线程，每次获取副本 value 值时，别的线程并不能获得当前线程的 value 值，形成了副本的隔离，互不干扰

这样设计的好处
每个 Map 存储的 Entry 数目更少，降低哈希冲突
当 Thread 销毁时，ThreadLocalMap 也会被销毁

内存泄漏

弱引用情况下：如果令 RESOURCE_1 = null 则，ThreadLocal 对象会被 GC 回收，两个弱引用从 Key<ThreadLocal> 变为 Key<null>，但此时 Entry 中的 value 还指向着堆中的数据，就发生了 内存泄漏
- 强引用情况下：Key -> ThreadLocal 的引用会导致 ThreadLocal 不能被回收

这种情况下，可以通过遍历 KeySet 找到 key == null，然后把对应的 value 也设置为 null 就可以在 GC 时回收堆空间，ThreadLocal 的 remove() 方法实现了上述逻辑

ThreadLocal remove() 方法

remove() 方法

/**
* Removes the current thread's value for this thread-local
* variable.  If this thread-local variable is subsequently
* {@linkplain #get read} by the current thread, its value will be
* reinitialized by invoking its {@link #initialValue} method,
* unless its value is {@linkplain #set set} by the current thread
* in the interim.  This may result in multiple invocations of the
* {@code initialValue} method in the current thread.
*
* @since 1.5
*/
public void remove() {
    ThreadLocalMap m = getMap(Thread.currentThread());
    if (m != null)
        m.remove(this);
}

又调用了 ThreadLocalMap 的 remove 方法，遍历所有 Entry 查看 key 是否为 null，其中又调用了 Entry 的 clear() 方法，以及 expungeStaleEntry(i)

ThreadLocalMap 的 remove 方法

/**
 * Remove the entry for key.
 */
private void remove(ThreadLocal<?> key) {
    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        if (e.get() == key) {
            e.clear();
            expungeStaleEntry(i);
            return;
        }
    }
}

expungeStaleEntry(i) 方法回收失效 Entry

/**
* Expunge a stale entry by rehashing any possibly colliding entries
* lying between staleSlot and the next null slot.  This also expunges
* any other stale entries encountered before the trailing null.  See
* Knuth, Section 6.4
*
* @param staleSlot index of slot known to have null key
* @return the index of the next null slot after staleSlot
* (all between staleSlot and this slot will have been checked
* for expunging).
*/
private int expungeStaleEntry(int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;

    // expunge entry at staleSlot
    tab[staleSlot].value = null;
    tab[staleSlot] = null;
    size--;

    // Rehash until we encounter null
    Entry e;
    int i;
    for (i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        ThreadLocal<?> k = e.get();
        if (k == null) {
            e.value = null; // 删除 value 的强引用
            tab[i] = null; // 从 ThreadLocalMap 中删除 Entry
            size--;
        } else {
            int h = k.threadLocalHashCode & (len - 1);
            if (h != i) {
                tab[i] = null;

                // Unlike Knuth 6.4 Algorithm R, we must scan until
                // null because multiple entries could have been stale.
                while (tab[h] != null)
                    h = nextIndex(h, len);
                tab[h] = e;
            }
        }
    }
    return i;
}

问题

看起来，应当手动使用 remove() 方法回收空间，否则就会内存泄漏，这样感觉有点蠢

很自然的有一种想法，在 set 新数据时，对可以被回收的空间进行回收
set 方法确实这么做了
get 方法其实也对空间进行了回收

set 方法回收空间

ThreadLocal 的 set 方法中调用了 ThreadLocalMap 的 set 方法

ThreadLocalMap 的 set 方法

/**
* Set the value associated with key.
*
* @param key the thread local object
* @param value the value to be set
*/
private void set(ThreadLocal<?> key, Object value) {

    // We don't use a fast path as with get() because it is at
    // least as common to use set() to create new entries as
    // it is to replace existing ones, in which case, a fast
    // path would fail more often than not.

    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);

    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        ThreadLocal<?> k = e.get();

        if (k == key) {
            e.value = value;
            return;
        }

        if (k == null) { // 如果 key 不存在，需要占用 Map 的新空间
            replaceStaleEntry(key, value, i); // 找失效的Entry 替换它的位置
            return;
        }
    }

    tab[i] = new Entry(key, value);
    int sz = ++size;
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        rehash();
}

可以看到，如果 Key 不存在，表示会额外占用 Map 的空间，那么尝试替换已经失效的 Entry 占用的空间 replaceStaleEntry 方法，其中就调用了 expungeStaleEntry 方法清除失效的 Entry

replaceStaleEntry 方法

/**
* Replace a stale entry encountered during a set operation
* with an entry for the specified key.  The value passed in
* the value parameter is stored in the entry, whether or not
* an entry already exists for the specified key.
*
* As a side effect, this method expunges all stale entries in the
* "run" containing the stale entry.  (A run is a sequence of entries
* between two null slots.)
*
* @param  key the key
* @param  value the value to be associated with key
* @param  staleSlot index of the first stale entry encountered while
*         searching for key.
*/
private void replaceStaleEntry(ThreadLocal<?> key, Object value,
                               int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;
    Entry e;

    // Back up to check for prior stale entry in current run.
    // We clean out whole runs at a time to avoid continual
    // incremental rehashing due to garbage collector freeing
    // up refs in bunches (i.e., whenever the collector runs).
    int slotToExpunge = staleSlot;
    for (int i = prevIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = prevIndex(i, len))
        if (e.get() == null)
            slotToExpunge = i;

    // Find either the key or trailing null slot of run, whichever
    // occurs first
    for (int i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        ThreadLocal<?> k = e.get();

        // If we find key, then we need to swap it
        // with the stale entry to maintain hash table order.
        // The newly stale slot, or any other stale slot
        // encountered above it, can then be sent to expungeStaleEntry
        // to remove or rehash all of the other entries in run.
        if (k == key) {
            e.value = value;

            tab[i] = tab[staleSlot];
            tab[staleSlot] = e;

            // Start expunge at preceding stale entry if it exists
            if (slotToExpunge == staleSlot)
                slotToExpunge = i;
            cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
            return;
        }

        // If we didn't find stale entry on backward scan, the
        // first stale entry seen while scanning for key is the
        // first still present in the run.
        if (k == null && slotToExpunge == staleSlot)
            slotToExpunge = i;
    }

    // If key not found, put new entry in stale slot
    tab[staleSlot].value = null;
    tab[staleSlot] = new Entry(key, value);

    // If there are any other stale entries in run, expunge them
    if (slotToExpunge != staleSlot)
        cleanSomeSlots(expungeStaleEntry(slotToExpunge), len);
}

get 方法回收空间

Get 方法调用了 getEntry 方法

getEntry 方法

private Entry getEntry(ThreadLocal<?> key) {
    int i = key.threadLocalHashCode & (table.length - 1);
    Entry e = table[i];
    if (e != null && e.get() == key)
        return e;
    else
        return getEntryAfterMiss(key, i, e);
}

get 方法又调用了 getEntryAfterMiss 方法，其中使用 enpungeStaleEntry 对空间进行回收

getEntryAfterMiss

private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
    Entry[] tab = table;
    int len = tab.length;

    while (e != null) {
        ThreadLocal<?> k = e.get();
        if (k == key)
            return e;
        if (k == null)
            expungeStaleEntry(i);
        else
            i = nextIndex(i, len);
        e = tab[i];
    }
    return null;
}

弱引用可以解决内存泄漏问题吗

只靠弱引用不能解决内存泄漏问题
通过弱引用只是实现了对失效 Entry 的标记（key == null）
还需要找到这些 Entry 进行回收

Hash 计算与 Hash 冲突

ThreadLocalMap 构造方法

ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
    //底层维护Entry的数组
    table = new Entry[INITIAL_CAPACITY];
    //计算索引(重点代码）
    int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
    //设置值
    table[i] = new Entry(firstKey, firstValue);
    size = 1;
    //设置阈值
    setThreshold(INITIAL_CAPACITY);
}

计算索引

原子整型、HASH_INCREMENT、哈希算法

private final int threadLocalHashCode = nextHashCode();

private static int nextHashCode() {
    return nextHashCode.getAndAdd(HASH_INCREMENT);
}
//AtomicInteger是一个提供原子操作的Integer类，通过线程安全的方式操作加减,适合高并发情况下的使用
private static AtomicInteger nextHashCode =  new AtomicInteger();
//特殊的hash值
private static final int HASH_INCREMENT = 0x61c88647;

这里定义了一个AtomicInteger类型，每次获取当前值并加上HASH_INCREMENT，HASH_INCREMENT = 0x61c88647,这个值跟斐波那契数列（黄金分割数）有关，其主要目的就是为了让哈希码能均匀的分布在2的n次方的数组里, 也就是Entry[] table中，这样做可以尽量避免hash冲突

计算hash的时候里面采用了 hashCode & (size - 1) 的算法，这相当于取模运算 hashCode % size 的一个更高效的实现。正是因为这种算法，我们要求size必须是2的整次幂，这也能保证在索引不越界的前提下，使得hash发生冲突的次数减小。

开放定址法——线性探测处理哈希冲突

private void set(ThreadLocal<?> key, Object value) {

    Entry[] tab = table;
    int len = tab.length;
    //上文计算过的索引
    int i = key.threadLocalHashCode & (len-1);
    //线性探索的过程，循环探索找到合适的坑位
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        ThreadLocal<?> k = e.get();
        //ThreadLocal 对应的 key 存在，直接覆盖之前的值
        if (k == key) {
            e.value = value;
            return;
        }
        // key为 null，但是value不为 null，说明之前的 ThreadLocal 对象已经被回收了，
        // 当前数组中的 Entry 是一个陈旧（stale）的元素
        if (k == null) {
            //GC操作，防止内存泄漏，后文讲到
            //将新值替换掉旧值
            replaceStaleEntry(key, value, i);
            return;
        }
    }
    //如果key为null，也没有旧的value，就新建一个Entry
    tab[i] = new Entry(key, value);
    int sz = ++size;
    /**
    * cleanSomeSlots用于清除那些e.get()==null的元素，
    * 这种数据key关联的对象已经被回收，所以这个Entry(table[index])可以被置null。
    * 如果没有清除任何entry,并且当前使用量达到了负载因子所定义(长度的2/3)，那么进行              rehash（执行一次全表的扫描清理工作）
    */
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        rehash();
}

/**
* 获取环形数组的下一个索引
*/
private static int nextIndex(int i, int len) {
    return ((i + 1 < len) ? i + 1 : 0);
}

首先还是根据key计算出索引 i，然后查找i位置上的Entry
若是Entry已经存在并且key等于传入的key，那么这时候直接给这个Entry赋新的value值
若是Entry存在，但是key为null，则调用replaceStaleEntry来更换这个key为空的Entry
不断循环检测，直到遇到为null的地方，这时候要是还没在循环过程中return，那么就在这个null的位置新建一个Entry，并且插入，同时size增加1
最后调用cleanSomeSlots，清理key为null的Entry，最后返回是否清理了Entry，接下来再判断 sz 是否>= thresgold达到了rehash的条件，达到的话就会调用rehash函数执行一次全表的扫描清理

Spring @Transaction 与 ThreadLocal

通过 Spring 管理数据库事务，一个线程 发起事务，在这个线程内获取 数据库连接，多个 DAO 对数据库表进行操作
如果自己实现这些的代码，直观的想法是在各个操作数据库的方法之间，传递同一个 Connection 连接对象，既然如此，不如把 Connection 对象存到当前线程里，用到的时候取出来，而不是在方法间传来传去
@Transaction 注解就是用 ThreadLocal 来存储当前数据库连接的

使用 ThreadLocal 的场景

在一次 Request 响应中，不使用多线程的情况下，就是用一个线程来完成整个后台逻辑的，那么一些信息就可以存储在 ThreadLocal 中，在整个 Controller -> Service -> Dao 之间都可以使用

面试题

1、和Synchronized的区别

问：他和线程同步机制（如：Synchronized）提供一样的功能，这个很吊啊。

答：放屁！同步机制保证的是多线程同时操作共享变量并且能正确的输出结果。ThreadLocal不行啊，他把共享变量变成线程私有了，每个线程都有独立的一个变量。举个通俗易懂的案例：网站计数器，你给变量count++的时候带上synchronized即可解决。ThreadLocal的话做不到啊，他没发统计，他只能说能统计每个线程登录了多少次。

2、存储在jvm的哪个区域

问：线程私有，那么就是说ThreadLocal的实例和他的值是放到栈上咯？

答：不是。还是在堆的。ThreadLocal对象也是对象，对象就在堆。只是JVM通过一些技巧将其可见性变成了线程可见。

3、真的只是当前线程可见吗

问：真的只是当前线程可见吗？

答：貌似不是，貌似通过InheritableThreadLocal类可以实现多个线程访问ThreadLocal的值，但是我没研究过，知道这码事就行了。

4、会导致内存泄漏么

问：会导致内存泄漏么？

答：分析一下：

1、ThreadLocalMap.Entry的key会内存泄漏吗？2、ThreadLocalMap.Entry的value会内存泄漏吗？先看下key-value的核心源码

staticclass Entry extends WeakReference<ThreadLocal<?>> { Object value; Entry(ThreadLocal<?> k, Object v) { super(k); value = v; }}

先看继承关系，发现是继承了弱引用，而且key直接是交给了父类处理super(key)，父类是个弱引用，所以key完全不存在内存泄漏问题，因为他不是强引用，它可以被GC回收的。

弱引用的特点：如果这个对象只被弱引用关联，没有任何强引用关联，那么这个对象就可以被GC回收掉。弱引用不会阻止GC回收。这是jvm知识。

再看value，发现value是个强引用，但是想了下也没问题的呀，因为线程终止了，我管你强引用还是弱引用，都会被GC掉的，因为引用链断了（jvm用的可达性分析法，线程终止了，根节点就断了，下面的都会被回收）。

这么分析一点毛病都没有，但是忘了一个主要的角色，那就是线程池，线程池的存在核心线程是不会销毁的，只要创建出来他会反复利用，生命周期不会结束掉，但是key是弱引用会被GC回收掉，value强引用不会回收，所以形成了如下场面：

Thread->ThreadLocalMap->Entry(key为null)->value

由于value和Thread还存在链路关系，还是可达的，所以不会被回收，这样越来越多的垃圾对象产生却无法回收，早晨内存泄漏，时间久了必定OOM。

解决方案ThreadLocal已经为我们想好了，提供了remove()方法，这个方法是将value移出去的。所以用完后记得remove()。

5、为什么用Entry数组而不是Entry对象

这个其实主要想考ThreadLocalMap是在Thread里持有的引用。

问：ThreadLocalMap内部的table为什么是数组而不是单个对象呢？

答：因为你业务代码能new好多个ThreadLocal对象，各司其职。但是在一次请求里，也就是一个线程里，ThreadLocalMap是同一个，而不是多个，不管你new几次ThreadLocal，ThreadLocalMap在一个线程里就一个，因为ThreadLocalMap的引用是在Thread里的，所以它里面的Entry数组存放的是一个线程里你new出来的多个ThreadLocal对象。

6、你学习的开源框架哪些用到了ThreadLocal

Spring框架。

DateTimeContextHolder

RequestContextHolder

7、ThreadLocal里的对象一定是线程安全的吗

未必，如果在每个线程中ThreadLocal.set()进去的东西本来就是多线程共享的同一个对象，比如static对象，那么多个线程的ThreadLocal.get()获取的还是这个共享对象本身，还是有并发访问线程不安全问题。

ThreadLocal#

Thread、ThreadLocal、ThreadLocalMap、Entry#

为什么 ThreadLocal 可以解决线程安全问题

强引用与弱引用#

弱引用与强引用的区别#

ThreadLocal 内存结构图#

内存泄漏#

ThreadLocal remove() 方法#

问题

set 方法回收空间#

get 方法回收空间#

弱引用可以解决内存泄漏问题吗#

Hash 计算与 Hash 冲突#

计算索引#

开放定址法——线性探测处理哈希冲突#

Spring @Transaction 与 ThreadLocal#

使用 ThreadLocal 的场景#

面试题#

1、和Synchronized的区别#

2、存储在jvm的哪个区域#

3、真的只是当前线程可见吗#

4、会导致内存泄漏么#

5、为什么用Entry数组而不是Entry对象#

6、你学习的开源框架哪些用到了ThreadLocal#

7、ThreadLocal里的对象一定是线程安全的吗#

ThreadLocal

Thread、ThreadLocal、ThreadLocalMap、Entry

强引用与弱引用

弱引用与强引用的区别

ThreadLocal 内存结构图

内存泄漏

ThreadLocal remove() 方法

set 方法回收空间

get 方法回收空间

弱引用可以解决内存泄漏问题吗

Hash 计算与 Hash 冲突

计算索引

开放定址法——线性探测处理哈希冲突

Spring @Transaction 与 ThreadLocal

使用 ThreadLocal 的场景

面试题

1、和Synchronized的区别

2、存储在jvm的哪个区域

3、真的只是当前线程可见吗

4、会导致内存泄漏么

5、为什么用Entry数组而不是Entry对象

6、你学习的开源框架哪些用到了ThreadLocal

7、ThreadLocal里的对象一定是线程安全的吗