一文带你了解 C# DLR 的世界

在很久之前,我写了一篇文章dynamic结合匿名类型 匿名对象传参,里面我以为DLR内部是用反射实现的。因为那时候是心中想当然的认为只有反射能够在运行时解析对象的成员信息并调用成员方法。后来也是因为其他的事一直都没有回过头来把这一节知识给补上,正所谓亡羊补牢,让我们现在来大致了解一下DLR吧。

DLR 全称是 Dynamic Language Runtime(动态语言运行时)。这很容易让我们想到同在C#中还有一个叫 CLR 的东西,它叫 Common Language Runtime。那这两者有什么关系呢?这个后续再说

DLR 是 C#4.0 新引进来的概念,其主要目的就是为了动态绑定与交互.

C#关键字 dynamic

DLR 首先定义了一个核心类型概念,即动态类型。即在运行时确定的类型,动态类型的成员信息、方法等都只在运行时进行绑定。与CLR的静态类型相反,静态类型都是在C#编译期间通过一系列的规则匹配到最后的绑定。

将这种动态进行绑定的过程它有点类似反射,但其内部却和反射有很大的不同。这个稍微会谈到。

由动态类型构成的对象叫动态对象。

DLR一般有下列特点:

  1. 把CLR的所有类型全部隐式转成dynamic。如dynamic x = GetReturnAnyCLRType()

  2. 同样,dynamic几乎也可以转换成CLR类型。

  3. 所有含有动态类型的表达式都是在运行期进行动态计算的。

DLR发展到现在,我们几乎都使用了动态类型关键字 dynamic以及还有引用DLR的类库 Dapper等。

在我们不想创建新的静态类做DTO映射时,我们第一时间会想到动态类型。也经常性将dynamic作为参数使用。

这时候我们就要注意一些 dynamic 不为大多人知的一些细节了。

不是只要含有 dynamic 的表达式都是动态的。

什么意思呢,且看这段代码dynamic x = "marson shine";。这段代码很简单,就是将字符串赋值给动态类型 x。

大家不要以为这就是动态类型了哦,其实不是,如果单单只是这一句的话,C#编译器在编译期间是会把变量 x 转变成静态类型 object 的,等价于object x = "marson shine";。可能有些人会惊讶,为什么C#编译器最后会生成object类型的代码。这就是接下来我们要注意的。

dynamic 与object 的不可告人的关系

其实如果你是以 dynamic 类型为参数,那么实际上它就是等于 object 类型的。换句话说,dynamic在CLR级别就是object。其实这点不用记,我们从编译器生成的C#代码就知道了。

这里我用的是dotpeek查看编译器生成的c#代码。

这里顺便想问下各位,有没有mac下c#反编译的工具。求推荐

所以我们在写重载方法时,是不能以 object 和 dynamic 来区分的。

void DynamicMethod(object o);
void DynamicMethod(dynamic d);  // error 编译器无法通过编译:已经存在同名同形参的方法

如果说 dynamic 与 object 一样,那么它与 DLR 又有什么关系呢?

其实微软提供这么一个关键字,我认为是方便提供创建动态类型的快捷方式。而真正与动态类型密切相关的是命名空间System.Dynamic下的类型。主要核心类DynamicObject,ExpandoObject,IDynamicMetaObjectProvider ,关于这三个类我们这节先不谈。

DLR探秘

首先我们来大致了解C#4.0加入的重要功能 DLR,在编译器中处于什么层次结构。

在这里我引用 https://www.codeproject.com/Articles/42997/NET-4-0-FAQ-Part-1-The-DLR 这篇文章的一副结构图的意思

一文带你了解 C# DLR 的世界

动态编程 = CLR + DLR

这足以说明 DLR 在C#中的位置,虽然名字与CLR只有一个字母之差,但是它所处的层次其实是在CLR之上的。我们知道编译器将我们写的代码转换成IL,然后经由CLR转换成本地代码交由CPU执行可执行程序。那么实际上,DLR 是在编译期间和运行期做了大量工作。最后还是会将C#代码转换成CLR静态语言,然后再经由 CLR 将代码转换成本地代码执行(如调用函数等)。

现在我们来简要介绍一下DLR在编译期间做了什么。

到这里就不得不以例子来做说明了,我们就上面的例子稍加改造一下:

// program.cs
dynamic x = "marson shine";
string v = x.Substring(6);
Console.WriteLine(v);

为了节省篇幅,我简化并改写了难看的变量命名以及不必要的注释。生成的代码如下:

            object obj1 = (object) "marson shine";      staticCallSite1 = staticCallSite1 ?? CallSite<Func<CallSite, object, int, object>>.Create(Binder.InvokeMember(CSharpBinderFlags.None, "Substring", (IEnumerable<Type>) null, typeof (Example), (IEnumerable<CSharpArgumentInfo>) new CSharpArgumentInfo[2]      {        CSharpArgumentInfo.Create(CSharpArgumentInfoFlags.None, (string) null),        CSharpArgumentInfo.Create(CSharpArgumentInfoFlags.UseCompileTimeType | CSharpArgumentInfoFlags.Constant, (string) null)      }));
      object obj2 = ((Func<CallSite, object, int, object>) staticCallSite1.Target)((CallSite) staticCallSite1, obj1, 6);        staticCallSite2 = staticCallSite2 ?? CallSite<Action<CallSite, Type, object>>.Create(Binder.InvokeMember(CSharpBinderFlags.ResultDiscarded, "WriteLine", (IEnumerable<Type>) null, typeof (Example), (IEnumerable<CSharpArgumentInfo>) new CSharpArgumentInfo[2]        {          CSharpArgumentInfo.Create(CSharpArgumentInfoFlags.UseCompileTimeType | CSharpArgumentInfoFlags.IsStaticType, (string) null),          CSharpArgumentInfo.Create(CSharpArgumentInfoFlags.None, (string) null)        }));
      ((Action<CallSite, Type, object>) staticCallSite2.Target)((CallSite) staticCallSite2, typeof (Console), obj2);

上文的两个变量staticCallSite1,staticCallSite2 是静态变量,起到缓存的作用。

这里涉及到了DLR核心三个概念

  1. ExpressTree(表达式树):通过CLR运行时用抽象语法树(AST)生成代码并执行。并且它也是用来与动态语言交互的主要工具(如Python,JavaScript 等)

  2. CallSite(调用点):当我们写地调用动态类型的方法,这就是一个调用点。这些调用都是静态函数,是能够缓存下来的,所以在后续的调用,如果发现是相同类型的调用,就会更快得运行。

  3. Binder(绑定器):除了调用点之外,系统还需要知道这些方法如何调用,就比如例子中的通过调用Binder.InvokeMember方法,以及是那些对象类型调用的方法等信息。绑定器也是可以缓存的

总结

DLR运行过程我们总结起来就是,在运行时DLR利用编译运行期间生成的表达式树调用点绑定器代码,以及缓存机制,我们就可以做到计算的重用来达到高性能。在很早前从老赵的表达式树缓存系列文章也指出了,利用表达式树缓存性能最接近直接调用(当然不包括IL编程)。

现在我们就知道了为什么DLR能干出与反射相同的效果,但是性能要远比反射要高的原因了。