由于网络带宽的限制、硬盘内存空间的限制等原因,文件和数据的压缩是我们经常会遇到的一个需求。因此,.NET中提供了对于压缩和解压的支持:GZipStream类型和DeflateStream类型,它们位于System.IO.Compression命名空间下,且都继承于Stream类型(对文件压缩的本质其实是针对字节的操作,也属于一种流的操作),实现了基本一致的功能。.
下面的代码展示了GZipStream的使用方法,DeflateStream和GZipStream的使用方法几乎完全一致:
public class Program
{
// 缓存数组的长度
private const int bufferSize = 1024;
public static void Main(string[] args)
{
string test = GetTestString();
byte[] original = Encoding.UTF8.GetBytes(test);
byte[] compressed = null;
byte[] decompressed = null;
Console.WriteLine("数据的原始长度是:{0}", original.LongLength);
// 1.进行压缩
// 1.1 压缩进入内存流
using (MemoryStream target = new MemoryStream())
{
using (GZipStream gzs = new GZipStream(target, CompressionMode.Compress, true))
{
// 1.2 将数据写入压缩流
WriteAllBytes(gzs, original, bufferSize);
}
compressed = target.ToArray();
Console.WriteLine("压缩后的数据长度:{0}", compressed.LongLength);
}
// 2.进行解压缩
// 2.1 将解压后的数据写入内存流
using (MemoryStream source = new MemoryStream(compressed))
{
using (GZipStream gzs = new GZipStream(source, CompressionMode.Decompress, true))
{
// 2.2 从压缩流中读取所有数据
decompressed = ReadAllBytes(gzs, bufferSize);
}
Console.WriteLine("解压后的数据长度:{0}", decompressed.LongLength);
Console.WriteLine("解压前后是否相等:{0}", test.Equals(Encoding.UTF8.GetString(decompressed)));
}
Console.ReadKey();
}
// 01.取得测试数据
static string GetTestString()
{
StringBuilder builder = new StringBuilder();
for (int i = 0; i < 10; i++)
{
builder.Append("我是测试数据\r\n");
builder.Append("我是长江" + (i + 1) + "号\r\n");
}
return builder.ToString();
}
// 02.从一个流总读取所有字节
static Byte[] ReadAllBytes(Stream stream, int bufferlength)
{
Byte[] buffer = new Byte[bufferlength];
List<Byte> result = new List<Byte>();
int read;
while ((read = stream.Read(buffer, 0, bufferlength)) > 0)
{
if (read < bufferlength)
{
Byte[] temp = new Byte[read];
Array.Copy(buffer, temp, read);
result.AddRange(temp);
}
else
{
result.AddRange(buffer);
}
}
return result.ToArray();
}
// 03.把字节写入一个流中
static void WriteAllBytes(Stream stream, Byte[] data, int bufferlength)
{
Byte[] buffer = new Byte[bufferlength];
for (long i = 0; i < data.LongLength; i += bufferlength)
{
int length = bufferlength;
if (i + bufferlength > data.LongLength)
{
length = (int)(data.LongLength - i);
}
Array.Copy(data, i, buffer, 0, length);
stream.Write(buffer, 0, length);
}
}
}
上述代码的运行结果如下图所示:
需要注意的是:使用 GZipStream 类压缩大于 4 GB 的文件时将会引发异常。
通过GZipStream的构造方法可以看出,它是一个典型的Decorator装饰者模式的应用,所谓装饰者模式,就是动态地给一个对象添加一些额外的职责。对于增加新功能这个方面,装饰者模式比新增一个之类更为灵活。就拿上面代码中的GZipStream来说,它扩展的是MemoryStream,为Write方法增加了压缩的功能,从而实现了压缩的应用。
扩展:许多资料表明.NET提供的GZipStream和DeflateStream类型的压缩算法并不出色,也不能调整压缩率,有些第三方的组件例如SharpZipLib实现了更高效的压缩和解压算法,我们可以在nuget中为项目添加该组件。