.NET使用EF批量插入数据,一行代码性能飙升!

背景
小编最近接到一个任务,批量获取内部网站用TXT生成的日志,在闲时把日志插入到MySql数据库做分析。为了快速开发小编选择了Entity Framework Core,很快开发完成了。
测试数据不是很多,批量插入数据很快完成,效率很高。但是部署到线上问题来了,最开始也挺快,越到后面越慢,慢的无法接受。于是查询了一下官网和某度,只需加一句代码就可以让EF批量插入数据飙升。.

代码示例

开始的批量添加代码

public async void AddRangeAsync(List<T> entities)
{
    await _dbContext.AddRangeAsync(entities);
    await _dbContext.SaveChangesAsync();
}

在以上方法增加一行,如下:

public async void AddRangeAsync(List<T> entities)
{
    //批量添加需要将AutoDetectChangesEnabled给位false
    _dbContext.ChangeTracker.AutoDetectChangesEnabled = false;
    await _dbContext.AddRangeAsync(entities);
    await _dbContext.SaveChangesAsync();
}

原理

微软的解释:AutoDetectChangesEnabled默认值为 true。这可确保上下文在执行操作(例如 SaveChanges() 或返回更改跟踪信息)之前了解对跟踪实体实例所做的任何更改。如果禁用自动检测更改, DetectChanges() 则必须确保在修改实体实例时调用 。

如果不这样做,可能会导致某些更改在返回或返回过时的更改跟踪信息期间 SaveChanges() 无法持久保存。

这是啥意思呢?ChangeTracker的AutoDetectChangesEnabled属性是Entity Framework中的一个属性,用于控制是否自动检测实体的更改。

默认情况下,AutoDetectChangesEnabled属性的值为true,即自动检测更改。每次对实体进行更改(添加、删除、更新)时,Entity Framework会自动检测这些更改,并将其标记为“已更改”。这样,在调用SaveChanges方法时,Entity Framework会自动将这些更改应用到数据库中。

当AutoDetectChangesEnabled属性的值为true时,将对EF的性能造成一定的影响,尤其是批量插入数据。

对于插入操作,无论AutoDetectChangesEnabled的值为true还是false,都可以成功插入数据。因为插入操作本身就是一种新增操作,无需进行实体的更改检测。所以在批量插入时,建议把AutoDetectChangesEnabled设置为false。

设置为false具体对操作的数据有没有影响呢?

答案是肯定的,分情况。如果插入数据后有上下文操作,那么上下文不会自动更新实体的状态,如果没有后续操作可以忽略。

这就需要手动调用DetectChanges方法或将实体状态设置为“已更改”才能使上下文与数据库同步。

建议批量插入数据结束时,把AutoDetectChangesEnabled的值改为true。

结语

本文讲述了.NET用EF批量插入数据,改进性能的简单方法。

当然还有很多方法,比如可以使用EF批量添加扩展,可以在EF中执行SQL插入语句,还可以用EF执行存储过程的方式批量添加(SQL Server实验过,MySql未实验)等,大家还有啥好方法可以留言。

日志分析建议大家用mangodb或者ES等数据库,本案例只是临时数据分析。希望本文对你有所收获,欢迎留言或者吐槽。