`
lovnet
  • 浏览: 6879174 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
文章分类
社区版块
存档分类
最新评论

理解C#值类型与引用类型

阅读更多

今日查询.net中string属哪种类型时找到这篇文章,写得很清楚,转过来大家看。

从概念上看,值类型直接存储其值,而引用类型存储对其值的引用。这两种类型存储在内存的不同地方。在C#中,我们必须在设计类型的时候就决定类型实例的行为。这种决定非常重要,用《CLR via C#》作者Jeffrey Richter的话来说,“不理解引用类型和值类型区别的程序员将会给代码引入诡异的bug和性能问题(I believe that a developer who misunderstands the difference between reference types and value types will introduce subtle bugs and performance issues into their code.)”。这就要求我们正确理解和使用值类型和引用类型。

1. 通用类型系统

C#中,变量是值还是引用仅取决于其数据类型。

C#的基本数据类型都以平台无关的方式来定义。C#的预定义类型并没有内置于语言中,而是内置于.NET Framework中。.NET使用通用类型系统(CTS)定义了可以在中间语言(IL)中使用的预定义数据类型,所有面向.NET的语言都最终被编译为 IL,即编译为基于CTS类型的代码。

例如,在C#中声明一个int变量时,声明的实际上是CTS中System.Int32的一个实例。这具有重要的意义:

  • 确保IL上的强制类型安全;
  • 实现了不同.NET语言的互操作性;
  • 所有的数据类型都是对象。它们可以有方法,属性,等。例如:
inti;
i
=1;
strings;
s
=i.ToString();

MSDN的这张图说明了CTS中各个类型是如何相关的。注意,类型的实例可以只是值类型或自描述类型,即使这些类型有子类别也是如此。

2. 值类型

C#的所有值类型均隐式派生自System.ValueType:

  • 结构体:struct(直接派生于System.ValueType);
    • 数值类型:
      • 整型:sbyte(System.SByte的别名),short(System.Int16),int(System.Int32),long (System.Int64),byte(System.Byte),ushort(System.UInt16),uint (System.UInt32),ulong(System.UInt64),char(System.Char);
      • 浮点型:float(System.Single),double(System.Double);
      • 用于财务计算的高精度decimal型:decimal(System.Decimal)。
    • bool型:bool(System.Boolean的别名);
    • 用户定义的结构体(派生于System.ValueType)。
  • 枚举:enum(派生于System.Enum);
  • 可空类型(派生于System.Nullable<T>泛型结构体,T?实际上是System.Nullable<T>的别名)。

每种值类型均有一个隐式的默认构造函数来初始化该类型的默认值。例如:

inti=newint();

等价于:

Int32i=newInt32();

等价于:

inti=0;

等价于:

Int32i=0;

使用new运算符时,将调用特定类型的默认构造函数并对变量赋以默认值。在上例中,默认构造函数将值0赋给了i。MSDN上有完整的默认值表

关于int和Int32的细节,在我的另一篇文章中有详细解释:《理解C#中的System.Int32和int》。

所有的值类型都是密封(seal)的,所以无法派生出新的值类型。

值得注意的是,System.ValueType直接派生于System.Object。即System.ValueType本身是一个类类型,而不是值类型。其关键在于ValueType重写了Equals()方法,从而对值类型按照实例的值来比较,而不是引用地址来比较。

可以用Type.IsValueType属性来判断一个类型是否为值类型:

TestTypetestType=newTestType();
if(testTypetype.GetType().IsValueType)
{
Console.WriteLine(
"{0}isvaluetype.",testType.ToString());
}

3. 引用类型

C#有以下一些引用类型:

  • 数组(派生于System.Array)
  • 用户用定义的以下类型:
    • 类:class(派生于System.Object);
    • 接口:interface(接口不是一个“东西”,所以不存在派生于何处的问题。Anders在《C# Programming Language》中说,接口只是表示一种约定[contract]);
    • 委托:delegate(派生于System.Delegate)。
  • object(System.Object的别名);
  • 字符串:string(System.String的别名)。

可以看出:

  • 引用类型与值类型相同的是,结构体也可以实现接口;
  • 引用类型可以派生出新的类型,而值类型不能;
  • 引用类型可以包含null值,值类型不能(可空类型功能允许将 null 赋给值类型);
  • 引用类型变量的赋值只复制对对象的引用,而不复制对象本身。而将一个值类型变量赋给另一个值类型变量时,将复制包含的值。

对于最后一条,经常混淆的是string。我曾经在一本书的一个早期版本上看到String变量比string变量效率高;我还经常听说String是引用类型,string是值类型,等等。例如:

strings1="Hello,";
strings2="world!";
strings3=s1+s2;//s3is"Hello,world!"

这确实看起来像一个值类型的赋值。再如:

strings1="a";
strings2=s1;
s1
="b";//s2is still"a"

改变s1的值对s2没有影响。这更使string看起来像值类型。实际上,这是运算符重载的结果,当s1被改变时,.NET在托管堆上为s1重新分配了内存。这样的目的,是为了将做为引用类型的string实现为通常语义下的字符串。

4. 值类型和引用类型在内存中的部署

经常听说,并且经常在书上看到:值类型部署在栈上,引用类型部署在托管堆上。实际上并没有这么简单。

MSDN上说:托管堆上部署了所有引用类型。这很容易理解。当创建一个应用类型变量时:

objectreference=newobject();

关键字new将在托管堆上分配内存空间,并返回一个该内存空间的地址。左边的reference位于栈上,是一个引用,存储着一个内存地址;而这个地址指向的内存(位于托管堆)里存储着其内容(一个System.Object的实例)。下面为了方便,简称引用类型部署在托管推上。

再来看值类型。《C#语言规范》上的措辞是“结构体不要求在堆上分配内存(However, unlike classes, structs are value types and do not require heap allocation)”而不是“结构体在栈上分配内存”。这不免容易让人感到困惑:值类型究竟部署在什么地方?

4.1 数组

考虑数组:

int[]reference=newint[100];

根据定义,数组都是引用类型,所以int数组当然是引用类型(即reference.GetType().IsValueType为false)。

而int数组的元素都是int,根据定义,int是值类型(即reference[i].GetType().IsValueType为true)。那么引用类型数组中的值类型元素究竟位于栈还是堆?

如果用WinDbg去看reference[i]在内存中的具体位置,就会发现它们并不在栈上,而是在托管堆上。

实际上,对于数组:

TestType[]testTypes=newTestType[100];

如果TestType是值类型,则会一次在托管堆上为100个值类型的元素分配存储空间,并自动初始化这100个元素,将这100个元素存储到这块内存里。

如果TestType是引用类型,则会先在托管堆为testTypes分配一次空间,并且这时不会自动初始化任何元素(即testTypes[i]均为null)。等到以后有代码初始化某个元素的时候,这个引用类型元素的存储空间才会被分配在托管堆上。

4.2 类型嵌套

更容易让人困惑的是引用类型包含值类型,以及值类型包含引用类型的情况:

publicclassReferenceTypeClass
{
privateint_valueTypeField;
publicReferenceTypeClass()
{
_valueTypeField
=0;
}
publicvoidMethod()
{
intvalueTypeLocalVariable=0;
}
}
ReferenceTypeClassreferenceTypeClassInstance
=newReferenceTypeClass();//Whereis_valueTypeField?
referenceTypeClassInstance.Method();//WhereisvalueTypeLocalVariable?

publicstructValueTypeStruct
{
privateobject_referenceTypeField;
publicValueTypeStruct()
{
_referenceTypeField
=newobject();
}
publicvoidMethod()
{
objectreferenceTypeLocalVariable=newobject();
}
}
ValueTypeStructvalueTypeStructInstance
=newValueTypeStruct();//Whereis_referenceTypeField?
valueTypeStructInstance.Method();//WhereisreferenceTypeLocalVariable?

单看valueTypeStructInstance,这是一个结构体实例,感觉似乎是整块扔到栈上的。但是字段_referenceTypeField是引用类型,局部变量referenceTypeLocalVarible也是引用类型。

referenceTypeClassInstance也有同样的问题,referenceTypeClassInstance本身是引用类型,似乎应该整块部署在托管堆上。但字段_valueTypeField是值类型,局部变量valueTypeLocalVariable也是值类型,它们究竟是在栈上还是在托管堆上?

规律是:

  • 引用类型部署在托管堆上;
  • 值类型总是分配在它声明的地方:作为字段时,跟随其所属的变量(实例)存储;作为局部变量时,存储在栈上。

我们来分析一下上面的代码。对于引用类型实例,即referenceTypeClassInstance:

  • 从上下文看,referenceTypeClassInstance是一个局部变量,所以部署在托管堆上,并被栈上的一个引用所持有;
  • 值类型字段_valueTypeField属于引用类型实例referenceTypeClassInstance的一部分,所以跟随引用类型实例referenceTypeClassInstance部署在托管堆上(有点类似于数组的情形);
  • valueTypeLocalVariable是值类型局部变量,所以部署在栈上。

而对于值类型实例,即valueTypeStruct:

  • 根据上下文,值类型实例valueTypeStructInstance本身是一个局部变量而不是字段,所以位于栈上;
  • 其引用类型字段_referenceTypeField不存在跟随的问题,必然部署在托管堆上,并被一个引用所持有(该引用是valueTypeStruct的一部分,位于栈);
  • 其引用类型局部变量referenceTypeLocalVariable显然部署在托管堆上,并被一个位于栈的引用所持有。

所以,简单地说“值类型存储在栈上,引用类型存储在托管堆上”是不对的。必须具体情况具体分析。

5. 正确使用值类型和引用类型

这一部分主要参考《Effective C#》,并非本人原创,希望能让你加深对值类型和引用类型的理解。

5.1 辨明值类型和引用类型的使用场合

C#中,我们用struct/class来声明一个类型为值类型/引用类型。

考虑下面的例子:

TestType[] testTypes=newTestType[100];

如果TestTye是值类型,则只需要一次分配,大小为TestTye的100倍。而如果TestTye是引用类型,刚开始需要100次分配,分配后数组的各元素值为null,然后再初始化100个元素,结果总共需要进行101次分配。这将消耗更多的时间,造成更多的内存碎片。所以,如果类型的职责主要是存储数据,值类型比较合适。

一般来说,值类型(不支持多态)适合存储供 C#应用程序操作的数据,而引用类型(支持多态)应该用于定义应用程序的行为。

通常我们创建的引用类型总是多于值类型。如果以下问题的回答都为yes,那么我们就应该创建为值类型:

  • 该类型的主要职责是否用于数据存储?
  • 该类型的共有借口是否完全由一些数据成员存取属性定义?
  • 是否确信该类型永远不可能有子类?
  • 是否确信该类型永远不可能具有多态行为?

5.2 将值类型尽可能实现为具有常量性和原子性的类型

具有常量性的类型很简单:

  • 如果构造的时候验证了参数的有效性,之后就一直有效;
  • 省去了许多错误检查,因为禁止更改;
  • 确保线程安全,因为多个reader访问到同样的内容;
  • 可以安全地暴露给外界,因为调用者不能更改对象的内部状态。

具有原子性的类型都是单一的实体,我们通常会直接替换一个原子类型的整个内容。

下面是一个典型的可变类型:

publicstructAddress
{
privatestring_city;
privatestring_province;
privateint_zipCode;
publicstringCity
{
get{return_city;}
set{_city=value;}
}
publicstringProvince
{
get{return_province;}
set
{
ValidateProvince(value);
_province
=value;
}
}
publicintZipCode
{
get{return_zipCode;}
set
{
ValidateZipCode(value);
_zipCode
=value;
}
}
}

下面创建一个实例:

Addressaddress=newAddress();
address.City
="Chengdu";
address.Province
="Sichuan";
address.ZipCode
=610000;

然后更改这个实例:

address.City="Nanjing";//NowProvinceandZipCodeareinvalid
address.ZipCode=210000;//NowProvinceisstillinvalid
address.Province="Jiangsu";

可见,内部状态的改变意味着可能违反对象的不变式(invariant),至少是临时的违反。如果上面是一个多线程的程序,那么在 City更改的过程中,另一个线程可能看到不一致的数据视图。如果不是多线程的程序,也有问题:

  • 当ZipCode的值无效而抛出异常时,对象仅作了一部分改变,因此处于无效的状态,为了修复这个问题,需要在Address中添加相当多的内部校验代码;
  • 为了实现异常安全,我们需要在所有改变多个字段的客户代码处放上防御性的代码;
  • 线程安全也要求我们在每一个属性的访问器上添加线程同步检查。

显然,这是一个相当可观的工作量。下面我们把Address实现为常量类型:

publicstructAddress
{
privatestring_city;
privatestring_province;
privateint_zipCode;
publicAddress (stringcity,stringprovince,intzipCode)
{
_city
=city;
_province
=province;
_zipCode
=zipCode;
ValidateProvince(province);
ValidateZipCode(zipCode);
}
publicstringCity
{
get{return_city;}
}
publicstringProvince
{
get{return_province;}
}
publicintZipCode
{
get{return_zipCode;}
}
}

如果要改变Address,不能修改现有的实例,只能创建一个新的实例:

Addressaddress=newAddress("Chengdu","Sichuan",610000);//createainstance
address=newAddress("Nanjing","Jiangsu",210000);//modifytheinstance

address将不存在任何无效的临时状态。那些临时状态只存在于Address的构造函数执行过程中。这样一来,Address是异常安全的,也是线程安全的。

5.3 确保0为值类型的有效状态

.NET的默认初始化机制会将引用类型设置为二进制意义上的0,即null。而对于值类型,不论我们是否提供构造函数,都会有一个默认的构造函数,将其设置为0。

一种典型的情况是枚举:

publicenumSex
{
Male
=1;
Female
=2;
}

然后用做值类型的成员:

publicstructEmployee
{
privateSex_sex;
//other
}

创建Employee结构体将得到一个无效的Sex字段:

Employeeemployee=newEmployee ();

employee的_sex是无效的,因为其为0。我们应该将0作为一个为初始化的值明确表示出来:

publicSex
{
None
=0;
Male
=1;
Female
=2;
}

如果值类型中包含引用类型,会出现另一种初始化问题:

publicstructErrorLog
{
privatestring_message;
//other
}

然后创建一个ErrorLog:

ErrorLogerrorLog=newErrorLog ();

errorLog的_message字段将是一个空引用。我们应该通过一个属性来将_message暴露给客户代码,从而使该问题限定在ErrorLog 的内部:

publicstructErrorLog
{
privatestring_message;
publicstringMessage
{
get
{
return(_message! =null)?_message:string.Empty;
}
set{_message=value;}
}
//other
}

5.4 尽量减少装箱和拆箱

装箱指把一个值类型放入一个未具名类型的引用类型中,比如:

intvalueType=0;
objectreferenceType=i;//boxing

拆箱则是从前面的装箱对象中取出值类型:

objectreferenceType;
intvalueType=(int)referenceType;//unboxing

装箱和拆箱是比较耗费性能的,还会引入一些诡异的bug,我们应当避免装箱和拆箱。

装箱和拆箱最大的问题是会自动发生。比如:

Console.WriteLine("Afewnumbers:{0},{1}.",25,32);

其中,Console.WriteLine()接收的参数类型是(string,object,object)。因此,实际上会执行以下操作:

inti=25;
obejecto
=i;//boxing

然后把o传给WriteLine()方法。在WriteLine()方法的内部,为了调用i上的ToString()方法,又会执行:

inti=(int)o;//unboxing
stringoutput=i,ToString();

所以正确的做法应该是:

Console.WriteLine("Afewnumbers:{0},{1}.",25.ToString(),32.ToString());

25.ToString()只是执行一个方法并返回一个引用类型,不存在装箱/拆箱的问题。

另一个典型的例子是ArryList的使用:

publicstructEmployee
{
privatestring_name;
publicEmployee(stringname)
{
_name
=name;
}
publicstringName
{
get{return_name;}
set{_name=value;}
}
publicoverridestringToString()
{
return_name;
}
}
ArrayListemployees
=newArrayList();
employees.Add(
newEmployee("OldName"));//boxing
Employeeceo=(Employee)employees[0];//unboxing
ceo.Name="NewName";//employees[0].ToString()isstill"OldName"

上面的代码不仅存在性能的问题,还容易导致错误发生。

在这种情况下,更好的做法是使用泛型集合:

List<Employee> employees=newList<Employee>();

由于List<T>是强类型的集合,employees.Add()方法不进行类型转换,所以不存在装箱/拆箱的问题。

6. 总结

C#中,变量是值还是引用仅取决于其数据类型。

C#的值类型包括:结构体(数值类型,bool型,用户定义的结构体),枚举,可空类型。

C#的引用类型包括:数组,用户定义的类、接口、委托,object,字符串。

数组的元素,不管是引用类型还是值类型,都存储在托管堆上。

引用类型在栈中存储一个引用,其实际的存储位置位于托管堆。为了方便,本文简称引用类型部署在托管推上。

值类型总是分配在它声明的地方:作为字段时,跟随其所属的变量(实例)存储;作为局部变量时,存储在栈上。

值类型在内存管理方面具有更好的效率,并且不支持多态,适合用作存储数据的载体;引用类型支持多态,适合用于定义应用程序的行为。

应该尽可能地将值类型实现为具有常量性和原子性的类型。

应该尽可能地确保0为值类型的有效状态。

应该尽可能地减少装箱和拆箱。

7. 参考

  1. Effective C#
  2. Professional C#
  3. Programming .NET Components
  4. C#语言规范
  5. Type Fundamentals
分享到:
评论

相关推荐

    7理解C#值类型与引用类型[整理].pdf

    7理解C#值类型与引用类型[整理].pdf

    理解 C#值类型与引用类型.docx

    在C#编程中,理解值类型和引用类型是至关重要的,因为...总之,理解C#的值类型和引用类型有助于编写更高效、更稳定的代码。通过选择正确的类型和遵循最佳实践,开发人员可以避免常见的陷阱,提高程序的性能和可维护性。

    理解 C#值类型与引用类型 (2).docx

    在C#编程中,了解值类型(Value Types)与引用类型(Reference Types)的区别至关重要,因为这直接影响到程序的性能和正确性。这两种类型的本质差异在于它们如何在内存中存储和处理。 1. 通用类型系统(Common Type...

    理解 C#值类型与引用类型 (2).pdf

    理解C#中的值类型和引用类型有助于编写更高效、更健壮的代码。正确选择类型,合理利用内存,避免不必要的性能损失,是每个C#开发者必备的技能。 7. 参考 可以查阅《CLR via C#》等专业书籍,以及MSDN等权威文档,...

    理解 C#值类型与引用类型.pdf

    。。。

    C#值类型与引用类型区别

    在C#编程语言中,值类型和引用类型是两种基本的数据类型,它们在内存管理和操作方式上有着显著的差异。了解这些差异对于编写高效、安全的代码至关重要,尤其是在处理大量数据或复杂对象时。 首先,让我们来探讨值...

    理解C# String类型:特殊的引用类型

    C# String 类型:特殊的引用类型 C# String 类型是一个特殊的引用类型,它的实例是只读的。这意味着 String 类型的变量在被赋值时,实际上是重新创建了一个字符串,而不是修改原来的字符串。这点与其他引用类型不同...

    C#引用类型和值类型的区别

    在C#编程语言中,值类型和引用类型是两种主要的数据类型,它们...理解C#中的值类型和引用类型对于编写高效、可靠的代码至关重要。在编程实践中,根据数据的特性和使用场景选择合适的类型,能够优化内存使用和程序性能。

    C#中的值类型与引用类型深度解析:理解内存中的数据处理

    理解值类型和引用类型的区别对于C#程序员来说至关重要。它们在内存中的存储方式、性能特性以及适用场景都有所不同。正确地选择和使用这两种类型可以显著影响程序的性能和资源管理。通过本文的深入分析和代码示例,...

    C#引用类型的赋值 类的赋值

    在C#编程语言中,变量分为两种类型:值类型和引用类型。本文将重点介绍引用类型的赋值特点及其背后的实现机制。 #### 一、引用类型的定义与特点 在C#中,除了基本类型(如`int`、`char`、`float`等)之外的所有...

    C#基础知识 值类型装箱

    总结一下,C#中的值类型装箱是一个将值类型转换为引用类型的过程,允许值类型与null比较并参与多态操作,但会引入额外的内存消耗和性能开销。了解和合理运用装箱、解箱机制,是提升C#程序性能的关键之一。通过实践和...

    C#中的值类型和引用类型

    值类型与引用类型的转换: 1. 装箱(Boxing):将值类型转换为引用类型,会将值类型实例复制到堆上,生成一个对象引用。 2. 解箱(Unboxing):将引用类型转换回值类型,是从堆上提取出原始值类型实例的过程。 3. ...

    训练师脚本:《使用C#中的枚举、结构、值类型和引用类型

    **值类型与引用类型的比较**: - **性能**: - 值类型通常更快,因为它们直接存储在栈中。 - 引用类型通常更慢,因为它们存储在堆中并且涉及到额外的间接寻址开销。 - **内存消耗**: - 值类型可能会消耗更多内存...

    值类型与引用类型(.html)

    在C#编程语言中,值类型和引用类型是两种基本的数据类型,它们在内存管理和数据存储方式上有着显著的区别,这对于理解和优化代码性能至关重要。本文将深入探讨这两种类型的特性和应用场景。 1. 值类型(Value Types...

    c# 引用类型与值类型的区别详解

    用Jeffrey Richter(《CLR via C#》作者)的话来说,“不理解引用类型和值类型区别的程序员将会把代码引入诡异的陷阱和诸多性能问题”。这就要求我们正确理解和使用值类型和引用类型。值类型包括C#的基本类型(用...

    C#源代码-值类型和引用类型.zip

    理解C#中的值类型和引用类型是编写高效代码的关键。选择使用哪种类型取决于具体的需求,如性能、内存管理和代码复杂性等因素。在设计和实现C#程序时,合理地使用值类型和引用类型可以提高程序的性能和可维护性。在...

    深入理解c#t语言的特性

    C#中的类型转换包括数字类型之间的隐式和显式转换、枚举类型与数字类型之间的显式转换,以及结构类型与引用类型之间的转换。需要注意的是,结构类型之间不能直接转换,而引用类型之间的转换需要有继承关系。 其次,...

    c# 引用类型和值类型区别 (2).docx

    理解C#中的值类型和引用类型对于编写高效、无误的代码至关重要。程序员应根据需求选择合适的类型,以优化内存使用、提高执行效率,并避免可能出现的陷阱,如意外修改原始数据等问题。在处理大量数据或需要对象复用的...

    C#数据类型与变量

    【C#数据类型与变量】是编程学习中的基础部分,主要涵盖了C#语言中用于存储数据的不同类别以及如何声明和使用变量。C#是一种强类型的语言,这意味着在编写代码时必须为每个变量指定一个特定的数据类型。 数据类型...

    C#笔记值传递和引用传递

    在C#中,区分值类型和引用类型的一个特殊例子是字符串(string)。虽然在其他语言中可能被视为值类型,但在C#中,string是引用类型,这意味着字符串对象在内存堆中存储,通过引用传递。 关于内存管理,值类型存储在...

Global site tag (gtag.js) - Google Analytics