前言
打算整理c# 代码简化史系列,所以相关的整理一下,简单的引出一下概念。
什么是表达式树呢?
表达式树以树形数据结构表示代码,其中每一个节点都是一种表达式,比如方法调用和 x < y 这样的二元运算等。
这个是什么意思呢?用结构表示代码? 用静态的表示动态的,一般来说是某种约定。
比如计算机中的强弱电路,可能这样不好理解。举一个盒子的例子:
假设我要计算加法,那么如果表示加法呢?我用一个盒型结构,把第一个数放在第一个位置,把第二个数放在第二个位置,然后第三个位置我传入方法,表示第一个和第二个会执行第三个位置的方法,在这里呢,还是结构,因为并没有去运行,只是说组合了这样一种结构。
现在呢,假设按照某种约定组合成一种结构,那么这种就称为表达式,就是用来表示某种情况的嘛。然后呢,现在这种表达式是树,那么就叫表达式树了。
这里介绍一下表达式,来增强一波:
然后再来透析一波:
正文
用一个例子来表示正则表达吧,例子是官网的,但是官网解释的比较含糊,所以再来解释一波吧。
官网用的一个例子是:Where(company => (company.ToLower() == "coho winery" || company.Length > 16)).orderby(company=>company)
那么来看一下吧:
string[] companies = { "Consolidated Messenger", "Alpine Ski House", "Southridge Video", "City Power & Light",
"Coho Winery", "Wide World Importers", "Graphic Design Institute", "Adventure Works",
"Humongous Insurance", "Woodgrove Bank", "Margie's Travel", "Northwind Traders",
"Blue Yonder Airlines", "Trey Research", "The Phone Company",
"Wingtip Toys", "Lucerne Publishing", "Fourth Coffee" };
// The IQueryable data to query.
IQueryable<String> queryableData = companies.AsQueryable<string>();
有一个数组,然后转换成IQueryable 格式,这么做的目的其实就是因为queryable 实现了一些expression的属性。
好吧,暂时就不解释这几个参数的作用,后面看下去自然就明白了。
接着放代码:
ParameterExpression pe = Expression.Parameter(typeof(string), "company");
这个意思就是说创建了一个属性是company的变量,相当于我们以前的xy,名字随便取。
Expression left = Expression.Call(pe, typeof(string).GetMethod("ToLower", System.Type.EmptyTypes));
Expression right = Expression.Constant("coho winery");
Expression e1 = Expression.Equal(left, right);
因为其实树结构,那么这里的参数left就是左子树,right 就是右子树。
left 呢,这个call 就是说pe(也就是company变量)将会执行一个方法,ToLower,对应的就是company.ToLower()。
然后右边就是一个固定的参数coho winery,现在的表达式就是company.ToLower()=='coho winery',返回的是一个bool类型。
left = Expression.Property(pe, typeof(string).GetProperty("Length"));
right = Expression.Constant(16, typeof(int));
Expression e2 = Expression.GreaterThan(left, right);
接下来就是就是获取compay的属性Length,然后和int 类型相比,就是conpany.length>16
Expression predicateBody = Expression.OrElse(e1, e2);
那么就是e1和e2相连,中间用的是or,company.ToLower() == "coho winery" || company.Length > 16 好的现在表达式完了,那么如何和数据联系在一起呢?
// Create an expression tree that represents the expression
// 'queryableData.Where(company => (company.ToLower() == "coho winery" || company.Length > 16))'
MethodCallExpression whereCallExpression = Expression.Call(
typeof(Queryable),
"Where",
new Type[] { queryableData.ElementType },
queryableData.Expression,
Expression.Lambda<Func<string, bool>>(predicateBody, new ParameterExpression[] { pe }));
// ***** End Where *****
// ***** OrderBy(company => company) *****
// Create an expression tree that represents the expression
// 'whereCallExpression.OrderBy(company => company)'
MethodCallExpression orderByCallExpression = Expression.Call(
typeof(Queryable),
"OrderBy",
new Type[] { queryableData.ElementType, queryableData.ElementType },
whereCallExpression,
Expression.Lambda<Func<string, string>>(pe, new ParameterExpression[] { pe }));
// ***** End OrderBy *****
// Create an executable query from the expression tree.
IQueryable<string> results = queryableData.Provider.CreateQuery<string>(orderByCallExpression);
whereCallExpression 和 orderByCallExpression 表示要执行的操作,用whereCallExpression 举例目标类型是Queryable,调用where,然后表达式是predicateBody,参数是pe。
orderByCallExpression 类推。
最后一步就是传递表达:IQueryable
里面的实现是非常复杂的,我自己也没有去看,因为觉得没有必要,这种东西就是一个工具,谁要是这样写,那可正是思维逻辑不是一般的强,一般来说和汇编差不多。
需要明白的就是它不会立即去执行,而是就是一个表达式和其紧密连接。有兴趣可以去了解iqueryable的实现,复杂的一批。
那么不管其多么复杂,就是本质上就是制定一套规则,我们按照它这个规则然后给我们填充,那么就会对应相应的结果给我们,我们可能设计不出这么好的表达式,但是有时候我们也会去制作相应的规则,比如说某种格式等,但你不要去想想它的代码多优雅,因为其稳定性很高,不需要追求优雅。
那么我们为了延后实现,我们就要去这样做吗?如果这样做的话,我想很多人会设计出另外一套,没有这么繁琐,可能就是几个参数,然后一个委托组合成一颗树,虽然很大的局限性,但是写这样的代码真的痛苦。
这个时候人们就想有没有什么能中间转换一下的呢?比如说我写一串字符,然后我就自动按照某种规则去解析不就可以了,但是这种有一个很不好的地方在于,字符串是弱类型调试相当麻烦,这时候就瞄准好了lambda了。
若 lambda 表达式被分配给 Expression<TDelegate> 类型的变量,则编译器可以发射代码以创建表示该 lambda 表达式的表达式树。
C# 编译器只能从表达式 Lambda(或单行 Lambda)生成表达式树。 它无法解析语句 lambda (或多行 lambda)。
举个例子:
Expression<Func<int, bool>> lambda = num => num < 5;
就可以使用lambda表达式进行一个expression的转换。
从Expression到Expression
Object
Expression
LambdaExpression
Expression<TDelegate>
很多时候lambda 表达式转换的表达式就可以为我们解决大部分问题,但是不要觉得这是Expression的全部,因为转换的只有一行,然后expression还有很多是无法用lambda来表示的。
续
未完待续。