`
Riddick
  • 浏览: 642140 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

彻底理解C、C++、WIN32与COM中的字符串

阅读更多

C/C++中的字符串问题在网上的讲解一向非常含糊,存在各个层次的库混用、滥用的情况,尤其是宽字符与窄字符等问题很难找到有效的资料,本篇随笔分享一下我长期收集到的一些比较准确的资料以及据此得到的个人理解.

C语言中的字符串

C语言中提供了两种字符类型char和wchar_t,C语言使用字符数组来表示字符串,同时支持两种直接量写法:"abcd"和 L"abcd" 来表示字符串常量文字量,C语言允许用字符串常量来初始化字符串。标准C函数库提供了printf和wprintf两个版本的输出函数。

#include <stdio.h> 
int main(){ 
    char str[] = "abcd"; 
    wchar_t wstr[] = L"abcd数学"; 
    printf("%s\n",str); 
    wprintf(L"%s\n",wstr); 
    return 0; 
}

 

纯C语言环境下,可以使用两个函数wcstombs和mbstowcs 来进行宽窄字符串的互相转换,下面一段是C语言中wcstombs的例子

#include <stdio.h> 
#include <stdlib.h> 
int main(){ 
    char str[] = "abcd"; 
    wchar_t wstr[] = L"bcda"; 
    wcstombs(str,wstr,sizeof(str)); 
    printf("%s\n",str); 
    return 0; 
} 

 

这两个函数都声明在C标准库头文件stdlib.h中。其它配套的字符串操作都在头文件string.h和wchar.h.

C++语言中的字符串

C++中我们有了字符串类string和wstring,这两个类都在头文件string当中,并且iostream中也提供了各自对应版本的输出流:

#include <string> 
#include <iostream> 
int main(){ 
    std::string str = "abcd"; 
    std::wstring wstr = L"abcd"; 
    std::cout<<str<<std::endl; 
    std::wcout<<wstr<<std::endl;  
    return 0; 
} 

 

C++中转换就很容易了,构造字符串的时候把另一个的迭代器传入就可以了:

#include <string> 
#include <iostream> 
int main(){ 
    std::string str = "abcd"; 
    std::wstring wstr(str.begin(),str.end()); 
    std::wcout<<wstr<<std::endl; 
    return 0; 
}

 

对于已经存在的字符串,可以用assign来赋值。因为宽字符有些窄字符中没有的字符,所以当你要指定一些转换规则时,可以使用头文件algorithm中的transform函数。其它字符串相关操作也在头文件string的类定义当中。

Win32编程中的字符串

但是我们实际编程中,遇到字符集问题比较多的情况是Win32编程。Win32SDK为了避免编译器造成的差异,用宏定义了自己的一套类型系统,其中字符类型就是CHAR和WCHAR,比较特别的是,Win32编程支持编译时的Unicode和非Unicode指定,所以Win32SDK又提供了TCHAR类型,它会根据是否是Unicode环境自动选择CHAR或者WCHAR类型,没有特别要求时,我们一般应该使用TCHAR

CHAR和WCHAR的字面值分别是"abcd"和L"abcd",TCHAR对应的字面值是_T"abcd",或者TEXT("abcd")。

Win32类型系统中还定义了字符串类型,见下表:

PSTR  PCSTR  LPSTR  LPCSTR
PTSTR PCTSTR LPTSTR LPCTSTR
PWSTR PCWSTR LPWSTR LPCWSTR

其中我们把STR的前缀分成了不同的颜色,红色前缀可能是P或者LP,P表示指针,LP表示长整型指针。大部分系统中P和LP是同一类型,所以这个前缀是不会造成区别的,可能64位C++或者一些旧的16位C++环境中会有区别。

蓝色前缀可能是C或者没有,这个很简单,表示是否是常量指针

粉色前缀可能是T、W或者没有,这对应着CHAR、WCHAR以及TCHAR
对于转换问题,Windows提供了两个API函数,这里就不实际举例了,具体请参看MSDN:
MultiByteToWideChar WideCharToMultiByte

其它与这些类型配套的Win32API函数请参看:MSDN中的参考

MFC中的CString类型提供了这些API的封装,编程时使用可以省去不少麻烦。

COM中的字符串

COM中提供了一个BSTR类型,它是OLECHAR的字符串形式(OLECHAR可能是WCHAR或者CHAR,取决于系统的OLE字符集),很多人因为看了它的宏定义:

typedef /* [wire_marshal] */ OLECHAR *BSTR;

认为它只是简单的OLECHAR *甚至WCHAR*,但是并非如此。BSTR所指向的内存地址前几个字节也是被分配的空间,用于存储BSTR的长度等信息。所以BSTR对应着一整套相关操作函数

  • SysAllocString
  • SysAllocStringByteLen
  • SysAllocStringLen
  • SysFreeString
  • SysReAllocString
  • SysReAllocStringLen
  • SysStringByteLen
  • SysStringLen

    如果你在自己分配的WCHAR*上使用这些函数,一定会导致问题。同样道理,如果你试图用delete去释放BSTR,也会造成错误。但是有相当一部分针对WCHAR的Win32API可以用在BSTR上。

     

    好了,就这么多了,希望您读了这篇随笔以后能对各种环境中的字符串有个整体认识。

  • 分享到:
    评论

    相关推荐

      c/c++复制字符串到剪粘板中

      C/C++复制字符串到剪粘板中 C/C++复制字符串到剪粘板中是指将字符串复制到剪粘板中,以便在其他应用程序中使用。这可以通过Win32 API和MFC来实现。 在Win32 API中,可以使用OpenClipboard、GetClipboardData、...

      C++字符串完全指引之Win32字符编码

      在C++编程中,特别是在与Win32 API交互时,理解和掌握不同的字符编码方式至关重要。本文将深入探讨Ansi(单字节字符)、Unicode(双字节字符,又称宽字符)以及Win32对这两种编码的支持。Win32 API为了兼容不同的...

      C++字符串中检测特定的字符串

      在C++编程中,处理字符串是一项常见的任务,尤其是在开发涉及文本处理的应用程序时。C++提供了多种方法来处理和操作字符串,包括标准库中的`std::string`类以及MFC库中的`CString`类。本篇文章将深入探讨如何在C++的...

      03 C#与C++dll互相传递字符串.rar

      这个示例展示了C#与C++之间字符串传递的基本流程,实际应用中可能需要处理更复杂的数据结构和错误处理。理解P/Invoke的工作原理以及跨语言边界的数据类型转换是关键,这有助于构建可扩展且健壮的多语言应用程序。

      c++ 与c#的中文字符串传递演示demo

      在C++中,可以使用`std::wstring`存储宽字符(Unicode)字符串,然后使用`wcstombs`转换为MBCS。在C#中,字符串默认使用Unicode编码(UTF-16),可以直接传递。为了确保兼容性,C++的DLL应接受两种编码格式。 4. **...

      中英文字符串分割算法C++C程序示例

      中英文字符串的切割边界的确定算法 &gt;&gt; 一些背景知识: 1. 一个汉字在c\c++的存储, 使用2个字节(char)存储; 2. 汉字存储的第一个char, 其值一定大于'~'(0111 1110=126),否则将导致识别歧义; 此处, 使用"单ASCII...

      详解C++ string常用截取字符串方法

      在C++编程中,`std::string`是一个非常重要的数据类型,用于表示和操作字符串。本文将详细解析两种常用的C++ `std::string`截取字符串的方法:`find`和`find_last_of`,以及如何结合使用它们来满足各种字符串处理...

      用c++比较两个字符串的大小

      ### 使用C++比较两个字符串的大小 在C++编程语言中,比较字符串是常见的操作之一。本篇文章将基于提供的代码示例,详细解释如何通过指针和`for`...希望这些知识点能够帮助大家更好地理解和掌握C++中的字符串处理技巧。

      C#将字符串数组传递给C++ DLL.rar

      C#中的字符串是引用类型,由.NET框架管理,而C++中的字符串可以是字符数组(char*)或宽字符数组(wchar_t*)。因此,传递字符串数组时,需要进行适当的类型转换。 1. **定义C++ DLL接口**: 在C++ DLL中,我们...

      C++_string.rar_C++ 字符_字符串 c++_字符串类_字符串编码_字符编码

      C++字符串完全指引之一 Win32 字符编码 C++字符串完全指引之二 字符串封装类 详细介绍了c++字符编码和字符串相关类

      用C++实现字符串倒序

      在实际开发中,`std::string`类通常更易于使用且功能强大,但理解和掌握C风格字符串处理也是必要的,因为有些场合下可能需要与C库或其他编程语言交互。通过这些基础知识的学习,我们可以更好地理解和运用C++来解决...

      详解C++中十六进制字符串转数字(数值)

      详解C++中十六进制字符串转数字(数值) 主要有两个方法,其实都是对现有函数的使用:  方法1: sscanf()  函数名: sscanf 功 能: 从字符串格式化输入 用 法: int sscanf(char *string, char *format[,...

      C++ 根据表示符号拆分字符串

      在C++编程中,字符串处理是一项基础且重要的任务。当我们需要根据特定的分隔符或标识符将一个长字符串拆分成多个子串时,可以使用不同的方法。标题“C++ 根据表示符号拆分字符串”所指的就是这个过程。在描述中提到...

      c++字符串加密解密

      在C++编程中,字符串加密和解密是信息安全领域中的重要技术,主要用于保护数据的隐私和安全性。本项目涉及的是DES(Data Encryption Standard)加密算法的实现,这是一种经典的对称加密算法,广泛应用于数据的加密...

      C语言,C++字符串处理函数

      以上介绍了 C 语言及 C++ 中常用的字符串处理函数,包括字符串长度计算、字符串数组元素计数、字符串与整数之间的相互转换以及字符串拷贝等。这些基本操作是进行更复杂字符串处理的基础。掌握这些函数能够帮助程序员...

      C++字符串完全指南

      - **C++字符串完全指南(2)-各种字符串类-CRT类**:这部分讨论了C运行时(CRT)库中与字符串相关的类和函数,如`strcpy`和`strlen`等。 - **C++字符串完全指南(2)-STL和ATL类**:这部分讲解了STL(标准模板库)和ATL...

      C++二维码生成库,直接调用即可,支持中文和各种各样字符串转二维码

      本项目聚焦于C++与Qt结合实现二维码(QR Code)生成的功能。下面我们将详细探讨相关知识点。 1. **Qt库**: Qt库是Qt公司提供的开源框架,适用于多种操作系统,如Windows、Linux、macOS等。它提供了一整套UI设计、...

      C++字符串输入

      在C++编程语言中,字符串处理是常见的需求之一,而C++提供了多种方式来处理字符串,其中最显著的区别在于传统的C风格字符串与C++的`std::string`类。本文旨在深入探讨C++中字符串输入的各种方法,并对比C风格字符串...

    Global site tag (gtag.js) - Google Analytics