================================================== Keywords: String Literal, Object, Array, Lvalue Author: whyglinux <whyglinux AT gmail DOT com> Date: 2007-05-16 ==================================================
C 和 C++ 字符串字面量(String Literal)既有相同之处,又有一些区别。了解这些内容对于加深字符串字面量以及相关一些概念的理解、澄清一些常见的概念误区不无助益。本文以普通字符串字面量 "hello" 为例总结说明如下。
如果你发现了本文中的错误,或者对本文有什么感想或建议,可通过 whyglinux AT gmail DOT com 邮箱和作者联系。
相同点:
- 字符串字面量是对象
C/C++ 中的对象(Object)指的是一块存储区。字符串字面量是不需要创建过程就可使用的对象,所以它既没有变量那样的声明或者定义(字符串字面量是无名对象),也不需要象动态分配的对象那样进行动态分配。由于这个原因,用来限定变量的类型限定符(如 const、volatile)以及存储类别指示符(如 extern、static、auto、register)不能用在修饰字符串字面量上。
- 数组类型
字符串字面量是数组类型的对象,因而具有数组的一切特点。关于这一点在下面还会进一步说明。
- 静态存储期
C/C++ 中对象的生存期按照其存储性质可分为三类:静态存储期(static storage duration)、自动存储期(automatic storage duration)以及动态存储期(dynamic storage duration)。相应地,对象可根据存储期性质分为静态对象、自动对象和动态对象三种。
字符串字面量是静态对象,所以在程序运行期间会一直存在。
- 字符串字面量是左值,而且是不可被更改的左值
例如,char s[] = "hello"; 中的 “hello” 是数组类型的左值(lvalue),用于初始化 s 数组;sizeof( "hello" ) 以及 &"hello" 中的 "hello" 也都是左值。在这些情况下,"hello" 处于左值语义上下文环境中,所以不会产生下面将要提到的数组转换为指针的现象。
另外,有些运算不但要求其操作数是左值,还要求可变。例如,对对象进行赋值、自加、自减等运算。因为数组是不可被更改的左值,所以不能对数组进行这些操作,也就是说不存在数组类型的赋值、自加、自减等运算。
- 字符串字面量可以转换为指向其首第一个字符的指针
处于右值语义环境中的字符串字面量将被默认转换为指向第一个字符的指针。例如,char* p = "hello"; 中的 “hello” 在转换为字符指针后用于初始化指针变量 p;表达式 "hello"[0](相当于 *("hello" + 0) 或者 *"hello")中的 “hello” 也是同样转换为指针后参与下标运算,等等。
这种性质也是数组类型的特点。在右值语义环境下,一般类型的对象表示的值是由其存储内容决定的;而数组类型的对象与此不同,它代表的值不是来源于其内容,而是来源于数组对象首元素所在的地址。这是数组最为特殊的地方,也是人们容易产生误解的地方。
- 取址运算
字符串字面量是一个可取址的对象。例如:&"hello" 是合法的表达式。
- 地址常量
静态对象的地址在编译期间即可被确定,所以其地址(如 &"hello")是常量;而字符串字面量又可以从数组类型自动转换为指针(如 "hello" 转换为指针后等同于 &"hello"[0]),所以字符串字面量可以直接作为地址常量表达式来使用。
- 修改字符串字面量的行为是无定义的
下面的操作都试图修改字符串字面量中的第一个字符从而改变字符串字面量,所以其结果是无定义(Undefined)的:
”hello”[0] = ‘A’; /* Undefined */ char* p = “hello”; *p = ‘A’; /* Undefined */
使用了无定义行为的程序是错误的;避免在程序中出现无定义行为是程序员的责任。
区别点:
- 在类型限定上的不同
C 中的字符串字面量 "hello" 是数组类型 char[6](相应地,每个字符元素是无 const 限定的 char 型);作为右值使用的时候转换为指针类型 char*。
在 C++ 中 "hello" 是 char const [6] 类型(相应地,每个字符元素的类型是 char const);转换为指针使用的时候是 char const*、在特殊情况下也可以是 char*。
之所以在 C 中字符串字面量不是 const 数组(也就是说每个字符元素的类型不是 char const),是因为 C 要照顾或者考虑到标准制定之前已经存在的大量代码——那时的 C 语言还没有 const 关键字,如果硬性规定为 const 数组,则 char* p = "hello"; 这样的初始化或者 char* q; q = "hello"; 这样的赋值就是非法的了(因为右边的类型 char const* 不能默认转换为左边的类型 char* )。
同样,为了使上述代码能顺利通过编译过程,C++ 采取了另外一种策略:它规定了字符串字面量的类型是 const 数组,同时又特别规定了字符串字面量也可以有限制地转换为指向非常量的指针(对于 "hello" 来说就是 char*),从而解决了上述代码中存在的问题。不过,转换到 char* 主要是为了兼容以前的代码,这种转换被 C++ 标准标记为“Deprecated”,所以在写程序的时候不应该依赖于这种转换。
- C++ 中的字符串字面量是常量,而在 C 中不是常量。
正是由于标准在类型上的不同规定造成了在 C 和 C++ 中字符串字面量常量性质上的差别。
在 C 中,除了 string literals 和 compound literals(C99 only)之外,其它的 literals 都是常量;而在 C++ 中,包括 string literals 在内的所有 literals 都是常量(注意:C++ 中不存在 compound literals。)
在现实中,经常可以看到用“字符串常量”来指代“字符串字面量”的情况,其实对于 C 来说这是不正确的,因为在 C 中字符串字面量不属于常量;而对于 C++ 来说,“字符串常量”和“字符串字面量”实际上是一回事,只不过看问题的角度不同罢了。
顺便提一下:C++ 中的常量可以有对象常量(如字符串字面量、const 限定的对象)和非对象常量之分,而 C 中的常量不包含对象,它们最明显的特征就是不能进行取址运算,因此常量只能作为非左值(即右值)来使用。
- 语法及语义上的区别
C 中的字符串字面量不是常量,它的每个字符元素也不是常量,所以字符元素的不可变性仅仅表现在语义层面,但在语法和约束条件上没有要求。而 C++ 中字符串字面量是常量,每个字符元素也是常量,因此在语义和约束条件两方面都要求不能改变其中的每个字符元素;另外,出于兼容性考虑 C++ 还存在着特殊情况下的向非 const 指针的转换。
下面用具体的代码来对以上内容进行说明。
*"hello" = 'A';
表达式 *"hello" 代表字符串字面量的第一个字符元素对象。上述语句试图通过赋值操作改变第一个元素,当然这样的行为在 C 和 C++ 中都是无定义的。除了这个相同点外,还有如下的一些细微的区别:
在 C++ 中,*"hello" 是一个 const 对象(其类型是 const char。注意:这里的 "hello" 不会转换为 char* 指针、从而 *"hello" 不会是 char 类型),所以上述赋值违反了赋值号左操作数必须是一个可被改变的左值的约束条件。在此情况下,标准要求给出诊断信息。
在 C 中,*"hello" 是一个非 const 对象(其类型是 char),是一个可被改变的左值,所以不违背赋值的约束条件。在此情况下,尽管这个赋值操作是未定义的,标准对诊断信息没有要求。
char* p = "hello"; char* q; q = "hello"; void foo( char* s ); foo( "hello" );
上面的初始化和赋值语句中 "hello" 都能转换为 char* 指针类型,所以都是合法的。在 C++ 中,尽管 "hello" 作为指针使用时是 char const * 类型,在此情况下(如果不是 char* 类型则初始化或者赋值不能成立)基于对字符串字面量的特殊规定使它可以转换为 char * 使用。
要注意 C++ 中字符串字面量转换为指向非常量的指针是有限制的,仅仅在有明确的目标类型要求的情况下才能进行这样的转换,否则是非法的。比如下面的情况:
char* p = "hello" + 1; char* q; q = "hello" + 1; void foo( char* s ); foo( "hello" + 1 );
上述是合法的 C 代码,但是作为 C++ 代码是非法的。非法的原因在于:"hello" 转换为 char const * 指针类型,而不能转换为 char *,因为 + 运算符对其操作数的类型没有转换为 char* 这样直接的要求(因为无论是 char const * 还是 char* 都能进行指针加法运算),所以指针加法表达式的结果仍然是 char const * 类型。这样,上面指针的初始化或赋值操作就违反了在类型上的约束条件,需要给出诊断信息。
|
相关推荐
C 和 C++ 字符串字面量(String Literal)既有相同之处,又有一些区别。了解这些内容对于加深字符串字面量以及相关一些概念的理解、澄清一些常见的概念误区不无助益。本文以普通字符串字面量 "hello" 为例总结说明...
原生字符串字面量解决了在C++98中使用传统字符串字面量时遇到的一些问题,特别是关于宽字符和多字节字符集的处理。 在C++98中,我们通常使用双引号`"`来定义字符串字面量,例如`"Hello, World!"`。然而,这只能创建...
C 和 C++ 字符串字面量(String Literal)既有相同之处,又有一些区别。了解这些内容对于加深字符串字面量以及相关一些概念的理解、澄清一些常见的概念误区不无助益。本文以普通字符串字面量 "hello" 为例总结说明...
《C++字符串完全指南—第二部分:字符串的封装类》主要探讨了在C++中处理字符串的各种封装类,包括在Win32 API、MFC、STL、WTL和Visual C++运行时库中常见的字符串类型。这些封装类旨在解决C风格字符串(C-style ...
在C++中,用双引号括起来的文本就是字符串字面量,如:"Hello, World!"。它们实际上是一个字符数组,但C++会自动在末尾添加'\0'。 3. `std::string`的创建与初始化: 可以通过`std::string str = "example";`或`...
2. 字符数组与字符串字面量:C++也支持传统的字符数组来表示字符串,如`char str[] = "Hello, World!";`,但这种方式不如`std::string`灵活。 二、字符串操作 1. 连接(concatenation):使用`+`运算符或`append()`...
了解并熟练使用这些C++字符串函数,能让你在编写涉及字符串处理的代码时更加高效和安全。通过深入学习和实践,你将能够更好地应对各种字符串相关的编程挑战。在实际开发中,结合C++标准库提供的其他容器和算法,如`...
接下来,我们讨论C++中的字符串常量和字符串字面量。字符串字面量可以用双引号括起来,比如`"Hello"`,它们在内存中是只读的。为了实现多行字符串,可以使用三个双引号,如: ```cpp const char* multiLineStr = R"...
1. **构造字符串**: `std::string`类提供了多种构造函数,如无参构造(创建空字符串)、拷贝构造、初始化构造(用字符串字面量或字符数组初始化)等。例如,`std::string str = "Hello";`。 2. **访问和修改字符串*...
- 标准库:C++标准库提供了广泛的功能,包括输入输出、字符串操作、数学运算、数据结构等。 - 性能:C++通常提供接近于C语言的性能,因为它允许直接访问内存地址和底层硬件。 - 跨平台:C++代码可以在多种操作系统和...
在IT行业中,C++是一种强大的、...通过深入学习和实践这些C++字符串的知识点,你将能够熟练地在各种场景中使用字符串,无论是简单的文本处理还是复杂的算法实现。理解并掌握这些内容,对于提升C++编程能力至关重要。
- `const char*`常量表达式可以创建字符串字面量,如`const char* cstr = "Constant String";` 8. **字符串与容器**: - `std::string`可以方便地与`std::vector<char>`或`std::array<char>`相互转换,实现对底层...
6. **字符串比较**:使用`equals()`或`compareTo()`方法进行字符串内容的比较,注意区分字面量和引用的比较。 7. **正则表达式**:强大的字符串匹配工具,能进行复杂的查找、替换和验证操作。 此外,字符串处理还...
C++字符串是编程中不可或缺的一部分,它用于存储和操作文本数据。...综上所述,C++字符串处理既有C风格的函数,也有`std::string`类提供的高效和安全的接口。开发者可以根据具体需求选择合适的方法进行字符串操作。
C++11引入了原生字符串字面量(Raw String Literals),它是一种全新的字符串定义方式,旨在简化多行字符串或包含特殊字符的字符串编写。在C++11之前,当程序员需要在字符串中包含特殊字符,如路径中的反斜杠,或...
通过《C++字符串完全指南》,开发者将能够深入了解和熟练运用这些概念和技巧,从而在编程实践中更加得心应手。这份指南可能是由CSDN技术中心编写的,它是一个知名的中国程序员社区,提供了大量的技术资源和学习资料...
注意,由于历史原因,C++允许使用C风格的字符串字面量,但它不是现代C++推荐的做法。 在内存中存储字符串时,英文字符、空格和标点符号通常占用1个字节,而中文字符等宽体字符需要占用2个字节。因此,直接使用字符...
通过掌握这些基本的C++字符串检索技术,开发者能够有效地处理和分析文本数据,提高程序的功能性和效率。在进一步学习中,可以考虑探索更高级的字符串操作,如字符串流、宽字符和多字节字符串,以及更复杂的正则...
7. **字符串字面量中的转义字符**: 在字符串字面量中,如果需要使用反斜杠自身,必须写成`\\`,因为编译器会把单个`\`解释为转义字符的开始。 8. **实践应用**: 转义字符在编写控制台输出、文件读写、正则表达式等...
- 可以通过空构造函数创建一个空的`CCString`,或者使用C++字符串字面量或`std::string`对象初始化。 - 使用`fromUTF8`方法从UTF-8编码的字符数组创建`CCString`。 3. **常用操作**: - `append`:将一个字符串...