.NET Core多线程通关 (4) 锁机制

大家好，我是Edison。

去年换工作时系统复习了一下.NET Core多线程相关专题，学习了一线码农老哥的《.NET 5多线程编程实战》课程，我将复习的知识进行了总结形成本专题。

本篇，我们来继续复习一下异步的相关知识点，预计阅读时间10分钟。

上一篇：.NET Core多线程通关（3）异步 - 续

理解lock锁的底层原理

（1）为什么要用锁？

对某个共享代码区域（临界区）进行串行访问，使用lock来保证串行的安全。.

（2）lock的用法

lock (lockMe){   dict.Add(i.ToString(), DateTime.Now);}

（3）lock的本质

通过ILSpy反编译查看可以知道，lock是个语法糖，编译后其实是Monitor.Enter 和 Monitor.Exit 的封装。

try{    Monitor.Enter(lockMe, ref lockTake);    dict.Add(i.ToString(), DateTime.Now);}finally{    if (lockTake)    {       Monitor.Exit(lockMe);    }}

（4）lock为何需要引用类型？

首先，编译器要求lock中的所对象必须是引用类型。

其次，因为lock会用到对象头中的同步块索引来进行同步，值类型没有堆中的数据。

无锁化：线程的本地存储

（1）线程本地存储

static 的作用域在AppDomain下都可见，此时在多线程环境中，通过static共享变量的方式来同步，不可避免会出现锁竞争。

如果能将作用域范围缩小，比如缩小到Thread级别，就可以避免锁竞争。例如：ConcurrentBag就是一个好的例子。

（2）.NET中的解决方案

ThreadStatic（Attribute）：

当前线程拿到的是定义好的值，其他线程拿到的可能是默认值（值类型可能是0，引用类型可能是null，需要注意容错）

ThreadLocal：

最大的区别：ThreadStatic只在第一个线程初始化，ThreadLocal则会为每个线程初始化

（3）存储在哪里？

PEB 进程环境块
TEB 线程环境块
TLS 线程本地存储（Thread Local Storage），取决于一共有多少个DataSlot

（4）应用场景

用来做数据库连接池：DB连接池基于 ThreadLocal实现，每个线程只能看见自己的请求队列；

用来做链式追踪：比如Skywalking或Zipkin等，用到ThreadLocal做本地存储，记录完整的调用链条如：A -> B -> C -> D；

内核态锁知多少

（1）基于WaitHandle的内核锁

这种锁是基于Windows底层的内核数据结构来维护线程之间的同步，比如：

AutoResetEvent / ManualResetEvent
Semaphore
Mutex

（2）优缺点

需要从用户态切换到内核态，相对来说比较重量级，相对耗费时间；

内核模式的锁，不仅可用于创建线程同步，还可以创建进程同步。

用户态锁知多少

（1）用户态锁是啥？

lock(obj){    ... // todo [1ms]}

大部分都是在临界区进行等待时间很短（比如1ms）的加锁，能不能让thread在CLR或C#层面内旋（自旋）一下，从而提高性能呢？

使用用户态锁就可以避免上下文切换和内核切换带来的高开销。

（2）寻找解决方案

保持线程在用户态又要尽可能少的消耗CPU时间

时间片

- Windows中一个时间片大概是30ms
- Thread.Sleep(0)
  - 提前结束自己的时间片，然后把自己放入到就绪队列中，如果就绪队列中的线程优先级 >= Current Thread，那么其他线程会被调度
  - 如果就绪队列中的线程优先级 < Current Thread，那么Current Thread只能继续执行【低优先级线程得不到执行】
  - 整体CPU级别
- Thread.Yield()
  - 提前结束自己的时间片，如果当前逻辑CPU上的就绪队列上有待执行的线程，那么这个线程就会被调度（不考虑优先级）【低优先级线程可以得到执行】
  - 逻辑CPU级别

极端休眠时间

- Sleep(1)
  - 本质上和Sleep(1000)一样，都需要休眠

CAS原语

- read, operate, write => 打包成原子性

借助CLR内的AwareLock::SpinWait()

- C# SpinWait
- CLR SpinWait

（3）.NET内置的SpinLock（用户态）

SpinLock在用法上和lock关键字差不多的。

class Program{   public static SpinLock spinLock = new SpinLock();   public static int counter = 0;   static void Main(string[] args)   {       Parallel.For(1, 1000001, (i) =>       {           var lockTaken = false;           spinLock.Enter(ref lockTaken);           ++counter;           spinLock.Exit();        }   });   Console.WriteLine($"counter={counter}");   Console.ReadLine();}

（4）.NET CAS案例：Interlocked

CPU直接操作的，主要用在一些简单类型上：

read
operation
write

class Program{        public static SpinLock spinLock = new SpinLock();        public static int counter = 0;        static void Main(string[] args)        {            Parallel.For(1, 1000001, (i) =>            {                Interlocked.Increment(ref counter, 1);            });        Console.WriteLine($"counter={counter}");        Console.ReadLine();}

混合态锁知多少

混合锁：用户态模式+内核态模式

（1）ManualResetEventSlim

它是如何实现的？

lock
ManualResetEvent
CAS
SpinWait（轻量级自旋锁）、SpinLock

（2）SemaphoreSlim

它是如何实现的？

ManualResetEvent + lock + SpinWait

（3）ReaderWriterLockSlim

这个锁的内核版是 ReaderWriterLock，不带Slim就代表是内核态的锁。

这个锁顾名思义是读写锁，意思是：读可以并行，但写只能串行。

EnterWriteLock() 需要等待所有的reader或writer锁结束，才能开始

（4）CountdownEvent

这个锁可以实现类似MapReduce的效果。

它是如何实现的？

基于ManualResetEvent事件做了底层封装。

线程安全集合知多少

（1）线程安全集合

.NET中都有哪些线程安全的集合类型？

ConcurrentBag

对应非线程安全类型：List

ConcurrentQueue

对应非线程安全类型：Queue

ConcurrentStack

对应非线程安全类型：Stack

ConcurrentDictionary

对应非线程安全类型：Dictionary

（2）BlockingCollection

BlockingCollection 意为阻塞集合。

线程安全的集合可以转换为阻塞集合，只要它实现了IProducerConsumerCollection接口

BlockingCollection可以实现类似发布订阅的业务场景应用：

生产端Add进去发布的消息
消费者端通过GetConsumingEnumerable()方法阻塞等待发布的消息

ConcurrentDictonary的两个大坑

（1）Values的坑

观察现象
- - 业务场景：自己用ConcurrentDictionary封装了一个Cache
  - FullGC 将 LOH 上的对象回收了
  - - 所有>=85000byte的都会被纳入LOH
观察源码
- - Values方法每次都会生成一个新的List集合对象进行返回，每个对象都是大对象
如何改进
- - 禁止调用Values方法
  - 借助lock + Dictionary实现类似操作避免每次生成新的List集合对象

（2）GetOrAdd的坑

观察现象
- - 业务场景：自己用ConcurrentDictionary封装了一个Redis连接池缓存
  - 借助GetOrAdd实现的CreateInstance方法未能实现线程安全导致连接池被大量反复创建
观察源码
- - GetOrAdd方法中的valueFactory不是线程安全的
如何改进
- - 借助Lazy改造字典的Value对象，保证创建方法只被执行一次，比如：将RedisConnection改为Lazy

共享变量在Release模式下的Bug

（1）现象

同样的代码，通过共享变量控制工作线程是否要结束自己，在Debug模式下没有问题，但是在Release模式下有问题。

（2）原因

JIT提供了错误的决策导致CPU在解析代码时做了优化，将共享变量存放在了CPU的寄存器中。

（3）WinDbg探究

Release模式
- - 查看memory中的共享变量的值
CPU寄存器
- - 查看共享变量的值

（4）解决方案

使用CancellationToken做取消
不用Cache，都读内存address中的对象，性能会相对较低
- - 将共享变量改为易变结构，比如：private bool _shouldStop 改为 private volatile bool _shouldStop

小结

本篇，我们复习了锁机制相关的知识点。

下一篇，我们将复习一下常见的.NET多线程相关的性能优化实践。

董川民