一、前言:
在c#数据结构中,集合的应用非常广泛,无论是做BS架构还是CS架构开发,都离不开集合的使用,比如我们常见的集合包括:Array、ArrayList、List、LinkedList等。这一些数据集合,在功能上都能够实现集合的存取,但是他们内部有什么区别,在使用时需要注意一些什么呢?下面根据个人的经验,对这一些集合数据的使用做一个简单的小结,如果说的不对的地方,欢迎指出,多多交流改进。.
二、Array集合简介
Array集合,也就是数组,是最简单的数据结构,其存储的数据在内存空间是连续的,数组有一下一些特点
-
1.数据存储是连续的
-
2.数组长度在定义时就必须制定
-
3.数组存储的数据类型都是同一类型
-
4.数组可以直接通过小标访问
优缺点:
优点:
1、可以根据索引直接访问,访问速度快
2、数据是安全的,由于数据类型一致性,在存储使用过程中不涉及
缺点:
1、由于数据是连续存储的,导致插入效率变慢
2、由于数组长度大小固定,那么对预期非固定长度的数字不好处理
练习实例代码:
/// <summary>
/// 数组练习操作
/// </summary>
public class ArrayTest
{
/// 数组 Array 对于大家来说一点都不陌生
/// 数组是在内存连续分配的存储空间,这也导致数组有一下一些特点
/// 1.数据存储是连续的
/// 2.数组长度在定义时就必须制定
/// 3.数组存储的数据类型都是同一类型
/// 4.数组可以直接通过小标访问
///
/// 优缺点:
/// 优点:
/// 1、可以根据索引直接访问,访问速度快
/// 2、数据是安全的,由于数据类型一致性,在存储使用过程中不涉及到装箱拆箱操作
/// 缺点:
/// 1、由于数据是连续存储的,导致插入效率变慢
/// 2、由于数组长度大小固定,那么对预期非固定长度的数字不好处理
/// int类型的数组操作
public static void IntArrayTest()
{
//// 定义一个秒表,执行获取执行时间Stopwatch st = new Stopwatch();//实例化类st.Start();//开始计时Console.WriteLine("开始初始化长度为10000000的int数组:");//// 定义一个数组int[] nums = new int[10000000];for (int i = 0; i < 10000000; i++){nums[i] = 1 + 1;}//需要统计时间的代码段st.Stop();//终止计时Console.WriteLine(string.Format("初始化长度为10000的int数组完毕!总耗时{0}毫秒", st.ElapsedMilliseconds.ToString()));}}
三、ArrayList集合简介
ArrayList 是Array的升级版,能够解决Array的一些缺点
ArrayList其内部实现也是Array,只是其长度是可以动态,在其内部用一个变量记录控制长度,ArrayList有如下一些特点
-
1.长度不固定
-
2.可以存储不同的数据类型(object)
-
3.同样支持索引查询(可以直接通过小标访问)
-
4.灵活性更强,以牺牲性能为代价
优缺点:
优点:
1、长度不固定,在定义是不必担长度溢出
2、可以存储任意数据类型
3、可根据索引查询,查询效率快
缺点:
1、由于长度不固定,执行效率低下,因为超出默认长度(10)后,会自动扩容拷贝数据,牺牲性能
2、由于存储类型是object,所以在存数据时会有装箱操作,在取数据时会有拆箱操作,影响效率
3、线程不安全,因为其内部实现是用size、array来共同控制,在新增操作时是非原子操作,所以非安全线程
使用技巧:
在实际使用过程中,为了避免自动扩容,可以预估数据长度,初始化一个数据长度,从而提高效率
练习实例代码:
/// <summary>/// ArrayList数组练习操作/// </summary>public class ArrayListTest{/// ArrayList 是Array的升级版,能够解决Array的一些缺点/// ArrayList其内部实现也是Array,只是其长度是可以动态,在其内部用一个变量记录控制长度,ArrayList有如下一些特点/// 1.长度不固定/// 2.可以存储不同的数据类型(object)/// 3.同样支持索引查询(可以直接通过小标访问)/// 4.灵活性更强,以牺牲性能为代价/// 优缺点:/// 优点:/// 1、长度不固定,在定义是不必担长度溢出/// 2、可以存储任意数据类型/// 3、可根据索引查询,查询效率快/// 缺点:/// 1、由于长度不固定,执行效率低下,因为超出默认长度(10)后,会自动扩容拷贝数据,牺牲性能/// 2、由于存储类型是object,所以在存数据时会有装箱操作,在取数据时会有拆箱操作,影响效率/// 3、线程不安全,因为其内部实现是用size、array来共同控制,在新增操作时是非原子操作,所以非安全线程////// 使用技巧:/// 在实际使用过程中,为了避免自动扩容,可以预估数据长度,初始化一个数据长度,从而提高效率/// ArrayList操作实例public static void ArrayListOpert(){//// 定义一个秒表,执行获取执行时间Stopwatch st = new Stopwatch();//实例化类//// 需要统计时间的代码段(统计初始化长度时的执行时间)st.Start();//开始计时Console.WriteLine("");Console.WriteLine("");Console.WriteLine("ArryList集合存储数据量为10000000,初始化一个长度,执行开始:");ArrayList arrayList = new ArrayList(10000000);//// 定义一个数组for (int i = 0; i < 10000000; i++){arrayList.Add(1 + 1);}st.Stop();//终止计时Console.WriteLine(string.Format("ArryList集合存储数据量为10000000,初始化一个长度,执行完毕:!总耗时{0}毫秒", st.ElapsedMilliseconds.ToString()));//// 需要统计时间的代码段(统计初始化非指定长度时的执行时间)st.Restart();Console.WriteLine("");Console.WriteLine("ArryList集合存储数据量为10000000,初始化不指定长度,执行开始:");arrayList = new ArrayList();//// 定义一个数组for (int i = 0; i < 10000000; i++){arrayList.Add(1 + 1);}st.Stop();//终止计时Console.WriteLine(string.Format("ArryList集合存储数据量为10000000,初始化不指定长度,执行完毕:!总耗时{0}毫秒", st.ElapsedMilliseconds.ToString()));}}
四、List集合简介
随着c#泛型的推出,为了避免ArrayList一些缺点,微软推出了List集合
List集合内部还是采用的Array实现,同时在定义时需要指定对应的数据类型
这样级保留了Array集合的优点,同时也避免了ArrayList集合的数据类型不安全和装箱带来的性能牺牲
List特点:
-
1、数据长度不固定,自动增加
-
2、存储相同的数据类型
-
3、可根据索引查询,查询效率快
优缺点:
优点:
1、长度不固定,在定义是不必担长度溢出
2、存储相同数据类型的数据,避免的数据的装箱拆箱,提高了数据处理效率
3、支持索引查询,查询效率快
缺点:
1、由于长度不固定,执行效率低下,因为超出默认长度(10)后,会自动扩容拷贝数据,牺牲性能
2、线程不安全,因为其内部实现是用size、array来共同控制,在新增操作时是非原子操作,所以非安全线程
练习实例代码:
/// <summary>/// List练习操作/// </summary>public class ListTest{/// 随着c#泛型的推出,为了避免ArrayList一些缺点,微软推出了List集合/// List集合内部还是采用的Array实现,同时在定义时需要指定对应的数据类型/// 这样级保留了Array集合的优点,同时也避免了ArrayList集合的数据类型不安全和装箱带来的性能牺牲/// List特点:/// 1、数据长度不固定,自动增加/// 2、存储相同的数据类型/// 3、可根据索引查询,查询效率快////// 优缺点:/// 优点:/// 1、长度不固定,在定义是不必担长度溢出/// 2、存储相同数据类型的数据,避免的数据的装箱拆箱,提高了数据处理效率/// 3、支持索引查询,查询效率快/// 缺点:/// 1、由于长度不固定,执行效率低下,因为超出默认长度(10)后,会自动扩容拷贝数据,牺牲性能/// 2、线程不安全,因为其内部实现是用size、array来共同控制,在新增操作时是非原子操作,所以非安全线程/// ArrayList操作实例public static void ListOpert(){//// 定义一个秒表,执行获取执行时间Stopwatch st = new Stopwatch();//实例化类st.Start();//开始计时//// 需要统计时间的代码段(统计初始化长度时的执行时间)Console.WriteLine("");Console.WriteLine("");Console.WriteLine("List集合存储数据量为10000000,初始化一个长度,执行开始:");List<int> list = new List<int>(10000000);//// 定义一个数组for (int i = 0; i < 10000000; i++){list.Add(1 + 1);}//需要统计时间的代码段st.Stop();//终止计时Console.WriteLine(string.Format("List集合存储数据量为10000000,初始化一个长度,执行完毕:!总耗时{0}毫秒", st.ElapsedMilliseconds.ToString()));//// 需要统计时间的代码段(统计初始化非指定长度时的执行时间)st.Restart();Console.WriteLine("");Console.WriteLine("List集合存储数据量为10000000,初始化不指定长度,执行开始:");list = new List<int>();//// 定义一个数组for (int i = 0; i < 10000000; i++){list.Add(1 + 1);}st.Stop();//终止计时Console.WriteLine(string.Format("List集合存储数据量为10000000,初始化不指定长度,执行完毕:!总耗时{0}毫秒", st.ElapsedMilliseconds.ToString()));}}
五、LinkedList集合简介
LinkedList链表的底层是采用双向链表的方式实现,
在链表(Linked List)中,每一个元素都指向下一个元素,以此来形成了一个链(chain)
可以从头部和尾部插入数据,在存储内存上采用非连续方式存储,链表有如下一些特点
-
1、内存存储上是非连续的
-
2、能够支持从头部和底部同时插入
-
3、长度是非固定的
优缺点:
优点:
1、由于非连续存储,中部插入和删除元素效率高
2、长度非固定,在创建时不用考虑其长度
3、可以冲头部和底部添加元素
4、数据类型是安全的,在创建时需要指定的数据类型
缺点:
1、由于非连续存储,不能通过小标访问,查询效率低
练习实例代码:
/// <summary>/// LinkedList练习操作/// </summary>public class LinkedListTest {/// LinkedList链表的底层是采用双向链表的方式实现,/// 在链表(Linked List)中,每一个元素都指向下一个元素,以此来形成了一个链(chain)/// 可以从头部和尾部插入数据,在存储内存上采用非连续方式存储,链表有如下一些特点/// 1、内存存储上是非连续的/// 2、能够支持从头部和底部同时插入/// 3、长度是非固定的/// 优缺点:/// 优点:/// 1、由于非连续存储,中部插入和删除元素效率高/// 2、长度非固定,在创建时不用考虑其长度/// 3、可以冲头部和底部添加元素/// 4、数据类型是安全的,在创建时需要指定的数据类型/// 缺点:/// 1、由于非连续存储,不能通过小标访问,查询效率低/// LinkedList操作实例public static void LinkedListTestOpert() {//// 定义一个秒表,执行获取执行时间Stopwatch st = new Stopwatch();//实例化类st.Start();//开始计时//// 需要统计时间的代码段(统计初始化长度时的执行时间)Console.WriteLine("");Console.WriteLine("");Console.WriteLine("Linked集合存储数据量为10000000,执行开始:");LinkedList<int> list = new LinkedList<int>();//// 定义一个数组for (int i = 0; i < 10000000; i++){list.AddFirst(1 + 1);}//需要统计时间的代码段st.Stop();//终止计时Console.WriteLine(string.Format("Linked集合存储数据量为10000000,执行完毕:!总耗时{0}毫秒", st.ElapsedMilliseconds.ToString()));}}
六、每种集合数据执行结果对比分析
class Program{static void Main(string[] args){/// array数组操作测试ArrayTest.IntArrayTest();/// arrayList集合操测试ArrayListTest.ArrayListOpert();//// List集合操作测试ListTest.ListOpert();//// LinkedList集合操作测试LinkedListTest.LinkedListTestOpert();///// 通过测试数据//通过测试数据大概可以分析得出一些结论//1、整体效率上Array效率最高,ArrayList效率最低,List效率介于Array和ArrayList之间//2、ArrayList和List集合,在定义时如果知道数据长度,那么初始化时,指定长度的效率比不指定的长度效率高//总结://在数据集合使用选择上给出以下一些建议://1、Array:当元素的数量是固定的,并且需要使用下标时//2、ArrayList:当存储的元素类型不同时//3、List:当元素的数量是固定的,并且需要使用下标时//4、LinkedList:当元素需要能够在列表的两端添加时Console.ReadLine();}}
执行结果数据

通过测试数据大概可以分析得出一些结论
1、整体效率上Array效率最高,ArrayList效率最低,List效率介于Array和ArrayList之间
2、ArrayList和List集合,在定义时如果知道数据长度,那么初始化时,指定长度的效率比不指定的长度效率高
七、总结:
在数据集合使用选择上给出以下一些建议:
1、Array:当元素的数量是固定的,并且需要使用下标时
2、ArrayList:当存储的元素类型不同时,初始化时给一个预估的长度
3、List:当元素的数量是固定的,并且需要使用下标时,初始化时给一个预估的长度
4、LinkedList:当元素需要能够在列表的两端添加时
附件:
关于这一些练习的代码,上传到github,有兴趣的可以看一下:
https://github.com/xuyuanhong0902/dataStructureTest.git