.NET你知道如何使用压缩流吗?

由于网络带宽的限制、硬盘内存空间的限制等原因,文件和数据的压缩是我们经常会遇到的一个需求。因此,.NET中提供了对于压缩和解压的支持:GZipStream类型和DeflateStream类型,它们位于System.IO.Compression命名空间下,且都继承于Stream类型(对文件压缩的本质其实是针对字节的操作,也属于一种流的操作),实现了基本一致的功能。.

下面的代码展示了GZipStream的使用方法,DeflateStream和GZipStream的使用方法几乎完全一致:

public class Program
{
    // 缓存数组的长度
    private const int bufferSize = 1024;

    public static void Main(string[] args)
    {
        string test = GetTestString();
        byte[] original = Encoding.UTF8.GetBytes(test);
        byte[] compressed = null;
        byte[] decompressed = null;
        Console.WriteLine("数据的原始长度是:{0}", original.LongLength);
        // 1.进行压缩
        // 1.1 压缩进入内存流
        using (MemoryStream target = new MemoryStream())
        {
            using (GZipStream gzs = new GZipStream(target, CompressionMode.Compress, true))
            {
                // 1.2 将数据写入压缩流
                WriteAllBytes(gzs, original, bufferSize);
            }
            compressed = target.ToArray();
            Console.WriteLine("压缩后的数据长度:{0}", compressed.LongLength);
        }
        // 2.进行解压缩
        // 2.1 将解压后的数据写入内存流
        using (MemoryStream source = new MemoryStream(compressed))
        {
            using (GZipStream gzs = new GZipStream(source, CompressionMode.Decompress, true))
            {
                // 2.2 从压缩流中读取所有数据
                decompressed = ReadAllBytes(gzs, bufferSize);
            }
            Console.WriteLine("解压后的数据长度:{0}", decompressed.LongLength);
            Console.WriteLine("解压前后是否相等:{0}", test.Equals(Encoding.UTF8.GetString(decompressed)));
        }
        Console.ReadKey();
    }

    // 01.取得测试数据
    static string GetTestString()
    {
        StringBuilder builder = new StringBuilder();
        for (int i = 0; i < 10; i++)
        {
            builder.Append("我是测试数据\r\n");
            builder.Append("我是长江" + (i + 1) + "号\r\n");
        }
        return builder.ToString();
    }

    // 02.从一个流总读取所有字节
    static Byte[] ReadAllBytes(Stream stream, int bufferlength)
    {
        Byte[] buffer = new Byte[bufferlength];
        List<Byte> result = new List<Byte>();
        int read;
        while ((read = stream.Read(buffer, 0, bufferlength)) > 0)
        {
            if (read < bufferlength)
            {
                Byte[] temp = new Byte[read];
                Array.Copy(buffer, temp, read);
                result.AddRange(temp);
            }
            else
            {
                result.AddRange(buffer);
            }
        }
        return result.ToArray();
    }

    // 03.把字节写入一个流中
    static void WriteAllBytes(Stream stream, Byte[] data, int bufferlength)
    {
        Byte[] buffer = new Byte[bufferlength];
        for (long i = 0; i < data.LongLength; i += bufferlength)
        {
            int length = bufferlength;
            if (i + bufferlength > data.LongLength)
            {
                length = (int)(data.LongLength - i);
            }
            Array.Copy(data, i, buffer, 0, length);
            stream.Write(buffer, 0, length);
        }
    }
}

上述代码的运行结果如下图所示:

.NET你知道如何使用压缩流吗?

需要注意的是:使用 GZipStream 类压缩大于 4 GB 的文件时将会引发异常。

通过GZipStream的构造方法可以看出,它是一个典型的Decorator装饰者模式的应用,所谓装饰者模式,就是动态地给一个对象添加一些额外的职责。对于增加新功能这个方面,装饰者模式比新增一个之类更为灵活。就拿上面代码中的GZipStream来说,它扩展的是MemoryStream,为Write方法增加了压缩的功能,从而实现了压缩的应用。

.NET你知道如何使用压缩流吗?

扩展:许多资料表明.NET提供的GZipStream和DeflateStream类型的压缩算法并不出色,也不能调整压缩率,有些第三方的组件例如SharpZipLib实现了更高效的压缩和解压算法,我们可以在nuget中为项目添加该组件。

.NET你知道如何使用压缩流吗?