`

MultiByteToWideChar和WideCharToMultiByte用法详解

 
阅读更多
MultiByteToWideChar和WideCharToMultiByte用法详解
今天写ini文件的时候发现的问题:

    TCHAR temp[128];
            //strcpy_s(temp, request.newVersion);
            MultiByteToWideChar(CP_ACP, 0, request.newVersion, -1, temp, 100);
            WritePrivateProfileString(L"DeviceInfo", L"firmwareVersion", temp/*(LPCWSTR)request.newVersion*//*L"1.0.15"*/, GetExPath() + L"DEVICEINFO.ini");


注意:

这两个函数是由Windows提供的转换函数,不具有通用性

C语言提供的转换函数为mbstowcs()/wcstombs()

一、函数简单介绍

涉及到的头文件:

函数所在头文件:windows.h

#include <windows.h>

wchar_t类型所需头文件:wchar.h

#include <wchar.h>

( 1 ) MultiByteToWideChar()

函数功能:该函数映射一个字符串到一个宽字符(unicode)的字符串。由该函数映射的字符串没必要是多字节字符组。

函数原型:

int MultiByteToWideChar(


  UINT CodePage,

  DWORD dwFlags,

  LPCSTR lpMultiByteStr,

  int cchMultiByte,

  LPWSTR lpWideCharStr,

  int cchWideChar

  );


参数:

1> CodePage:指定执行转换的多字节字符所使用的字符集

这个参数可以为系统已安装或有效的任何字符集所给定的值。你也可以指定其为下面的任意一值:


Value Description
CP_ACP ANSI code page
CP_MACCP Not supported
CP_OEMCP OEM code page
CP_SYMBOL Not supported
CP_THREAD_ACP Not supported
CP_UTF7 UTF-7 code page
CP_UTF8 UTF-8 code page
2> dwFlags:一组位标记,用以指出是否未转换成预作或宽字符(若组合形式存在),是否使用象形文字替代控制字符,以及如何处理无效字符。你可以指定下面是标记常量的组合,含义如下:

  MB_PRECOMPOSED:通常使用预作字符——就是说,由一个基本字符和一个非空字符组成的字符只有一个单一的字符值。这是缺省的转换选择。不能与MB_COMPOSITE值一起使用。

  MB_COMPOSITE:通常使用组合字符——就是说,由一个基本字符和一个非空字符组成的字符分别有不同的字符值。不能与MB_PRECOMPOSED值一起使用。

  MB_ERR_INVALID_CHARS:如果函数遇到无效的输入字符,它将运行失败,且GetLastErro返回ERROR_NO_UNICODE_TRANSLATION值。

  MB_USEGLYPHCHARS:使用象形文字替代控制字符。
组合字符由一个基础字符和一个非空字符构成,每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中,e就是基础字符,而重音符标记就是非空字符。
标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的,而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。
一般不使用这些标志,故取值为0时。
3> lpMultiByteStr:指向待转换的字符串的缓冲区。
4> cchMultiByte:指定由参数lpMultiByteStr指向的字符串中字节的个数。可以设置为-1,会自动判断lpMultiByteStr指定的字符串的长度
(如果字符串不是以空字符中止,设置为-1可能失败,可能成功),此参数设置为0函数将失败。
5> lpWideCharStr:指向接收被转换字符串的缓冲区。
6> cchWideChar:指定由参数lpWideCharStr指向的缓冲区的宽字节数。若此值为0,函数不会执行转换,而是返回目标缓存lpWideChatStr所需的宽字符数。
返回值:
如果函数运行成功,并且cchWideChar不为0,返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数;

如果函数运行成功,并且cchMultiByte为0,返回值是待转换字符串的缓冲区所需求的宽字符数大小。(此种情况用来获取转换所需的wchar_t的个数)

如果函数运行失败,返回值为零。

若想获得更多错误信息,请调用GetLastError()函数。它可以返回下面所列错误代码:


  ERROR_INSUFFICIENT_BUFFER;     ERROR_INVALID_FLAGS;

  ERROR_INVALID_PARAMETER;         ERROR_NO_UNICODE_TRANSLATION。
( 2 ) WideCharToMultiByte()
函数功能:该函数映射一个unicode字符串到一个多字节字符串。

函数原型:

int WideCharToMultiByte(


  UINT CodePage,

  DWORD dwFlags,

  LPCWSTR lpWideCharStr,

  int cchWideChar,

  LPSTR lpMultiByteStr,

  int cchMultiByte,

  LPCSTR lpDefaultChar,

  LPBOOL pfUsedDefaultChar

  );


参数:

与MultiByteToWideChar()函数中的参数类似,但是多了两个参数:

lpDefaultChar和pfUsedDefaultChar:只有当WideCharToMultiByte函数遇到一个宽字节字符,而该字符在uCodePage参数标识的代码页中并没有它的表示法时,WideCharToMultiByte函数才使用这两个参数。(通常都取值为NULL)

1> 如果宽字节字符不能被转换,该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL(这是大多数情况下的参数值),那么该函数使用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的,因为问号是个通配符。

2> pfUsedDefaultChar参数指向一个布尔变量,如果Unicode字符串中至少有一个字符不能转换成等价多字节字符,那么函数就将该变量置为TRUE。如果所有字符均被成功地转换,那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被成功地转换后,可以测试该变量。

返回值:

如果函数运行成功,并且cchMultiByte不为零,返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数;

如果函数运行成功,并且cchMultiByte为零,返回值是接收到待转换字符串的缓冲区所必需的字节数。(此种情况用来获取转换所需Char的个数)

如果函数运行失败,返回值为零。

若想获得更多错误信息,请调用GetLastError函数。它可以返回下面所列错误代码:


  ERROR_INSUFFICIENT_BJFFER;ERROR_INVALID_FLAGS;

  ERROR_INVALID_PARAMETER;ERROR_NO_UNICODE_TRANSLATION。


二、使用方法

( 1 ) 将多字节字符串转为宽字符串:

1) 调用MultiByteToWideChar()函数,设置cchWideChar参数为0(用以获取转换所需的接收缓冲区大小);

2) 获取输入缓存的大小,作为cchMultiByte的值;(这样做是为了节省空间,也可以给cchMultiByte取值-1(字符串需要以空字符结尾,否则会出错))

3) 分配足够的内存块,用于存放转换后的Unicode字符串;

该内存块的大小由前面对cchWideChar()函数的返回值来决定;(也可以用别的方法,但该方法更节省内存)

4) 再次调用MultiByteToWideChar()函数,这次将缓存的地址作为lpWideCharStr,参数来传递,并传递第一次调用MultiByteToWideChar()函数时的返回值作为cchWideChar参数的值;

5) 使用转换后的字符串;

6) 释放接收缓冲区占用的内存块;

示例代码:



复制代码
void main()
{
    char sBuf[25]={0};

    strcpy(sBuf, "我最棒");

    //获取输入缓存大小
    int sBufSize=strlen(sBuf);
    //获取输出缓存大小
    //VC++ 默认使用ANSI,故取第一个参数为CP_ACP
    DWORD dBufSize=MultiByteToWideChar(CP_ACP, 0, sBuf, sBufSize, NULL, 0);
    printf("需要wchar_t%u个\n", dBufSize);

    wchar_t * dBuf=new wchar_t[dBufSize];
    wmemset(dBuf, 0, dBufSize);

    //进行转换
    int nRet=MultiByteToWideChar(CP_ACP, 0, sBuf, sBufSize, dBuf, dBufSize);
   
    if(nRet Setting... -> locale -> default language ,选择"中文",然后编译即可。



Unicode :宽字节字符集
1. 如何取得一个既包含单字节字符又包含双字节字符的字符串的字符个数?
可以调用Microsoft Visual C++的运行期库包含函数_mbslen来操作多字节(既包括单字节也包括双字节)字符串。
调用strlen函数,无法真正了解字符串中究竟有多少字符,它只能告诉你到达结尾的0之前有多少个字节。
2. 如何对DBCS(双字节字符集)字符串进行操作?
函数 描述
PTSTR CharNext ( LPCTSTR ); 返回字符串中下一个字符的地址
PTSTR CharPrev ( LPCTSTR, LPCTSTR ); 返回字符串中上一个字符的地址
BOOL IsDBCSLeadByte( BYTE ); 如果该字节是DBCS字符的第一个字节,则返回非0值
3. 为什么要使用Unicode?
(1) 可以很容易地在不同语言之间进行数据交换。
(2) 使你能够分配支持所有语言的单个二进制.exe文件或DLL文件。
(3) 提高应用程序的运行效率。
Windows 2000是使用Unicode从头进行开发的,如果调用任何一个Windows函数并给它传递一个ANSI字符串,那么系统首先要将字符串转换成Unicode,然后将Unicode字符串传递给操作系统。如果希望函数返回ANSI字符串,系统就会首先将Unicode字符串转换成ANSI字符串,然后将结果返回给你的应用程序。进行这些字符串的转换需要占用系统的时间和内存。通过从头开始用Unicode来开发应用程序,就能够使你的应用程序更加有效地运行。
Windows CE 本身就是使用Unicode的一种操作系统,完全不支持ANSI Windows函数
Windows 98 只支持ANSI,只能为ANSI开发应用程序。
Microsoft公司将COM从16位Windows转换成Win32时,公司决定需要字符串的所有COM接口方法都只能接受Unicode字符串。
4. 如何编写Unicode源代码?
Microsoft公司为Unicode设计了WindowsAPI,这样,可以尽量减少代码的影响。实际上,可以编写单个源代码文件,以便使用或者不使用Unicode来对它进行编译。只需要定义两个宏(UNICODE和_UNICODE),就可以修改然后重新编译该源文件。
_UNICODE宏用于C运行期头文件,而UNICODE宏则用于Windows头文件。当编译源代码模块时,通常必须同时定义这两个宏。
5. Windows定义的Unicode数据类型有哪些?
数据类型 说明
WCHAR Unicode字符
PWSTR 指向Unicode字符串的指针
PCWSTR 指向一个恒定的Unicode字符串的指针
对应的ANSI数据类型为CHAR,LPSTR和LPCSTR。
ANSI/Unicode通用数据类型为TCHAR,PTSTR,LPCTSTR。
6. 如何对Unicode进行操作?
字符集 特性 实例
ANSI 操作函数以str开头 strcpy
Unicode 操作函数以wcs开头 wcscpy
MBCS 操作函数以_mbs开头 _mbscpy
ANSI/Unicode 操作函数以_tcs开头 _tcscpy(C运行期库)
ANSI/Unicode 操作函数以lstr开头 lstrcpy(Windows函数)
所有新的和未过时的函数在Windows2000中都同时拥有ANSI和Unicode两个版本。ANSI版本函数结尾以A表示;Unicode版本函数结尾以W表示。Windows会如下定义:
#ifdef UNICODE
#define CreateWindowEx CreateWindowExW
#else
#define CreateWindowEx CreateWindowExA
#endif // !UNICODE
7. 如何表示Unicode字符串常量?
字符集 实例
ANSI “string”
Unicode L“string”
ANSI/Unicode T(“string”)或_TEXT(“string”)if( szError[0] == _TEXT(‘J’) ){ }
8. 为什么应当尽量使用操作系统函数?
这将有助于稍稍提高应用程序的运行性能,因为操作系统字符串函数常常被大型应用程序比如操作系统的外壳进程Explorer.exe所使用。由于这些函数使用得很多,因此,在应用程序运行时,它们可能已经被装入RAM。
如:StrCat,StrChr,StrCmp和StrCpy等。
9. 如何编写符合ANSI和Unicode的应用程序?
(1) 将文本串视为字符数组,而不是chars数组或字节数组。
(2) 将通用数据类型(如TCHAR和PTSTR)用于文本字符和字符串。
(3) 将显式数据类型(如BYTE和PBYTE)用于字节、字节指针和数据缓存。
(4) 将TEXT宏用于原义字符和字符串。
(5) 执行全局性替换(例如用PTSTR替换PSTR)。
(6) 修改字符串运算问题。例如函数通常希望在字符中传递一个缓存的大小,而不是字节。这意味着不应该传递sizeof(szBuffer),而应该传递(sizeof(szBuffer)/sizeof(TCHAR)。另外,如果需要为字符串分配一个内存块,并且拥有该字符串中的字符数目,那么请记住要按字节来分配内存。这就是说,应该调用malloc(nCharacters *sizeof(TCHAR)),而不是调用malloc(nCharacters)。
10. 如何对字符串进行有选择的比较?
通过调用CompareString来实现。
标志 含义
NORM_IGNORECASE 忽略字母的大小写
NORM_IGNOREKANATYPE 不区分平假名与片假名字符
NORM_IGNORENONSPACE 忽略无间隔字符
NORM_IGNORESYMBOLS 忽略符号
NORM_IGNOREWIDTH 不区分单字节字符与作为双字节字符的同一个字符
SORT_STRINGSORT 将标点符号作为普通符号来处理
11. 如何判断一个文本文件是ANSI还是Unicode?
判断如果文本文件的开头两个字节是0xFF和0xFE,那么就是Unicode,否则是ANSI。
12. 如何判断一段字符串是ANSI还是Unicode?
用IsTextUnicode进行判断。IsTextUnicode使用一系列统计方法和定性方法,以便猜测缓存的内容。由于这不是一种确切的科学方法,因此 IsTextUnicode有可能返回不正确的结果。
13. 如何在Unicode与ANSI之间转换字符串?
Windows函数MultiByteToWideChar用于将多字节字符串转换成宽字符串;函数WideCharToMultiByte将宽字符串转换成等价的多字节字符串。   





参考:http://blog.csdn.net/xiaobai1593/article/details/7382984

        http://www.lxway.com/140002681.htm

C/C++基本语法学习 STL C++ primer
原文:https://www.cnblogs.com/ranjiewen/p/5770639.html</wchar.h></windows.h>
分享到:
评论

相关推荐

    MultiByteToWideChar和WideCharToMultiByte用法详解.docx

    《MultiByteToWideChar和WideCharToMultiByte函数详解》 在Windows开发中,处理不同编码格式的字符串转换是一项常见的任务。MultiByteToWideChar和WideCharToMultiByte是Windows API提供的两个关键函数,用于在多...

    MultiByteToWideChar和WideCharToMultiByte用法详解.pdf

    【MultiByteToWideChar函数详解】 MultiByteToWideChar是一个Windows API函数,它的主要作用是将一个多字节字符串转换为宽字符(Unicode)字符串。在处理不同编码的字符串时,这个函数非常有用,特别是在需要在多...

    C++宽字符与普通字符的转换实例详解

    其中,使用 MultiByteToWideChar 函数和 WideCharToMultiByte 函数是最常用的方法。MultiByteToWideChar 函数可以将普通字符转换为宽字符,而 WideCharToMultiByte 函数可以将宽字符转换为普通字符。 在将普通字符...

    VB簡繁轉化(简繁转换)

    例如,可以调用Windows API中的"MultiByteToWideChar"和"WideCharToMultiByte"函数进行字符集的转换。同时,也可以通过编写自定义函数,利用字典映射的方式,将简体字符映射到对应的繁体字符。这种方式虽然效率较低...

    多字节与UTF-8、Unicode之间的转换

    - 使用`MultiByteToWideChar`函数将多字节字符串转换为宽字符字符串(WCHAR数组)。 - 再通过`WideCharToMultiByte`函数将宽字符字符串转换为UTF-8编码的字符序列。 2. **UTF8ToMB** 该函数实现了从UTF-8编码...

    VB6内置的内码转换功能(中文繁简体转换)

    在VB6(Visual Basic 6)编程环境中,开发者可以利用内置的内码转换功能来实现中文繁简体的转换。这种转换是通过处理字符编码来完成的,涉及到字符...在实际开发中,理解字符编码原理和API的正确使用方法是至关重要的。

    char与wchar_t互转

    2. **Windows API函数**:`WideCharToMultiByte`和`MultiByteToWideChar`函数是Windows平台下进行字符编码转换的主要手段。 3. **内存管理**:在转换过程中,需要注意动态分配和释放内存资源,避免内存泄漏。 #### ...

    c++各种字体编码的转换

    具体来说,我们可以使用`MultiByteToWideChar`和`WideCharToMultiByte`这两个函数来进行转换。 ##### 2.1 GBK转UTF-8 ```cpp stringGBKToUTF8(const std::string& strGBK) { string strOutUTF8 = ""; WCHAR* str...

    char*转为LPCWSTR

    以下代码展示了如何使用 `WideCharToMultiByte` 和 `MultiByteToWideChar` 函数进行字符串转换: ```cpp #include #include #include using namespace std; int main(int argc, _TCHAR* argv[]) { unsigned ...

    utf-8与unicode

    这些函数使用了Windows API中的`MultiByteToWideChar()`和`WideCharToMultiByte()`函数来完成转换。例如,`ANSIToUnicode()`函数中: ```c int textlen; wchar_t* result; textlen = MultiByteToWideChar(CP_ACP, 0...

    Ansi、Unicode、UTF8字符串之间的转换,wprintf

    1. 使用 `MultiByteToWideChar` 函数,该函数可以将 Ansi 字符串转换为 Unicode 字符串。 2. 使用 `setlocale` 函数设置当前地域信息,并使用 `swprintf` 函数将 Ansi 字符串转换为 Unicode 字符串。 Unicode 转 ...

    Unicode、Ascall、UTF8相互转化

    ### Unicode、ASCII、UTF-8 相互转换详解 #### 一、引言 在计算机科学领域,字符编码是将人类可读的文本转换为计算机能够处理的形式的关键技术。Unicode、ASCII 和 UTF-8 是三种非常重要的字符编码标准。本文将详细...

    WINDOWS下UNICODE操作.txt

    在需要进行编码转换时,可以利用 Windows 提供的 `MultiByteToWideChar` 和 `WideCharToMultiByte` 函数来实现 Unicode 和 ANSI 之间的转换。这些函数非常强大且灵活,支持多种转换选项,如指定转换错误处理方式、...

    关于cocos2dx中文转UTF8码的解决方案.docx

    在Windows平台上,可以利用Win32 API提供的函数实现字符编码转换,如`WideCharToMultiByte`和`MultiByteToWideChar`。这两个函数可以帮助我们将GB2312编码转换为UTF-8编码。具体实现示例如下: ```cpp const char* ...

    类型转换集锦

    3. **文件内容转换**:建议使用 `MultiByteToWideChar` 和 `WideCharToMultiByte` 函数。 #### `CString`与`std::string`的转换 - `CString`到`std::string`: ```cpp CString strMfc = "test"; std::string ...

    UTF-8与GB2312之间的互换.doc

    这一过程可以使用Windows API函数`WideCharToMultiByte`来实现,其中参数`CodePage`设置为GB2312对应的代码页值936。 **从GB2312转换到UTF-8:** 相反的过程,即从GB2312编码的文本转换到UTF-8,也需要先将GB2312...

    cstring的相关知识.docx

    总结来说,CString是MFC框架中处理字符串的强大工具,它支持多种字符串转换和操作,同时也需要了解其他常见的字符串类型如BSTR、char*、wstring等,以及它们之间的转换方法。掌握这些转换和操作有助于提高编程效率,...

    新编WIN32API大全

    - **性能优势**:相比使用封装好的类库和控件,直接调用API可以减少额外的封装开销,提高执行效率。 - **灵活性**:能够处理更为复杂和特殊的应用场景。 #### 五、学习Win32 API的重要性 - **深入了解Windows内部...

    VC 函数库+各种功能的实现

    - **示例**: 使用`MultiByteToWideChar`和`WideCharToMultiByte`函数转换编码。 #### 十三、改变颜色(整个窗体的控件) - **知识点**: 改变控件颜色涉及到设置控件的背景色和前景色。 - **示例**: 使用`...

Global site tag (gtag.js) - Google Analytics