`

linux没有WideCharToMultiByte,MultiByteToWideChar,我们通常...

 
阅读更多

Linux下面的没有命名为 WideCharToMultiByte() 和 MultiByteToWideChar() 函数,WideCharToMultiByte,MultiByteToWideChar是windows下的函数,在linux下也有类似的两个函数:

mbstowcs()
wcstombs()

值得注意的是:

size_t mbstowcs(wchar_t *wcstr,const char *mbstr,size_t count);

这个函数的第三个参数count,大小一定要是mbstr长度的2倍,否则出来的中文也会是乱码

测试一下:

setlocale(LC_ALL,"zh_CN.GB18030");
wchar_t wcstr[20] = L"字符测试123abc";

int len = wcslen(wcstr)+1;
printf("len = %d /n",len);
for(int i = 0; i < len; i++)
printf("0x%08x ",wcstr[i]);
printf("/n");

char str[55] = {0};
int n = wcstombs(str,wcstr,55);
if(-1 == n)
{
perror("wcstombs ");
exit(-1);
}
printf("n = %d/n",n);
for(int i = 0; i < n+1; i++)
printf("0x%08x ",str[i]);
printf("/n");
wchar_t wch[50]={0};
int m = mbstowcs(wch,str,n);
if(m == -1)
{
perror("Converting");
exit(-1);
}
printf("m = %d/n",m);
for(int i =0; i<m+1;i++)
printf("0x%08x ",wch[i]);
printf("/n");
return 0;
}

还有呢,转码还可以使iconv函数族,包含以下三个函数:
iconv_t iconv_open(const char *tocode, const char *fromcode);

size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t *outbytesleft);

int iconv_close(iconv_t cd);

测试一下:

#include <stdio.h>
#include <iconv.h>
#include <string.h>

#define BUFLEN 256

char outbuf[BUFLEN];
char inbuf[BUFLEN] = "characters convertion";

int main()
{
char *pin = inbuf;
char *pout = outbuf;

int inlen = strlen(pin);
int outlen = BUFLEN;

int retsize;

iconv_t cd;

cd = iconv_open("UTF-8", "GBK");

if((iconv_t)-1 == cd) {
perror("iconv_open error");
return -1;
}

retsize = iconv(cd, &pin, (size_t *)&inlen, &pout, (size_t *)&outlen);

if((size_t)-1 == retsize) {
perror("iconv error");
return -2;
}

if(outlen > 0) {
printf("%s/n", outbuf);
}

iconv_close(cd);

return 0;
}

另外

关于Linux下转码的资料,这里比较全:

http://www.360doc.com/content/11/0119/14/1317564_87612492.shtml

仔细读,所有的问题基本都可以找到答案。

分享到:
评论

相关推荐

    C++写的Windows下GB2312与UTF-8相互转换代码.rar

    在这个案例中,开发者可能使用了`MultiByteToWideChar`和`WideCharToMultiByte`这两个Windows API函数。前者用于将多字节字符集(如GB2312)转换为宽字符集(UTF-16,Windows内部使用),后者则将宽字符集转换为多...

    多字节与UTF-8、Unicode之间的转换

    3. **Unicode**:Unicode是一种标准,旨在为世界上所有的字符提供统一且唯一的数字表示形式,通常以UCS-2或UCS-4的形式存储,分别使用2个或4个字节表示一个字符。这里我们关注的是UCS-2,即每个字符使用2个字节表示...

    C++ UTF-8与 Unicode互相转换.docx

    在这些函数中,`MultiByteToWideChar`和`WideCharToMultiByte`是Windows API提供的关键函数,它们负责处理字符编码的转换。`CP_ACP`参数代表默认的系统多字节字符集,通常在非Unicode程序中使用。 需要注意的是,...

    char与wchar_t互转

    2. **Windows API函数**:`WideCharToMultiByte`和`MultiByteToWideChar`函数是Windows平台下进行字符编码转换的主要手段。 3. **内存管理**:在转换过程中,需要注意动态分配和释放内存资源,避免内存泄漏。 #### ...

    C++实现编码转换的示例代码

    需要注意的是,这些示例代码没有涵盖Linux或其他非Windows系统的编码转换。在Linux环境下,可以使用`iconv`库来完成类似的任务,或者使用C++11标准库中的`std::wstring_convert`和`std::codecvt_utf8`等类。 总结:...

    vc6.0 网络程序测试终端

    在VC6.0环境中,可以利用标准库中的`MultiByteToWideChar`和`WideCharToMultiByte`函数进行GBK和UTF8之间的转换。前者用于GBK到Unicode的转换,后者则用于Unicode到UTF8的转换。正确使用这些函数,可以确保在与Linux...

    C语言UTF8到ANSI和Unicode转换代码

    例如,`MultiByteToWideChar`和`WideCharToMultiByte`函数可以分别用于ANSI到Unicode和Unicode到ANSI的转换。在MFC项目中使用这些函数,需要确保项目的字符集设置正确,通常设置为“多字节字符集”以便处理ANSI编码...

    UTF-8 UNICODE GBK 相互转换C源码

    在VS2005环境下,你可以使用C标准库中的`MultiByteToWideChar`和`WideCharToMultiByte`函数进行宽字符(UNICODE)与多字节字符(如GBK或UTF-8)之间的转换。同时,你需要包含`&lt;windows.h&gt;`头文件来使用这些函数。 ...

    json构造解析器及字符集转换工具

    在C++中进行字符集转换,通常需要使用特定的库函数,如在Windows环境下,可以使用MultiByteToWideChar和WideCharToMultiByte函数进行宽字符和多字节字符间的转换;在Linux或POSIX系统中,iconv库是常用来进行编码...

    如何使用HPSocket插件

    HPSocket是一款强大的网络通信组件,它为开发者提供了在Windows和Linux平台上进行高性能、高稳定性的网络编程的能力。本文将详细介绍如何使用HPSocket插件进行通信,以及如何通过中文信息进行交互。 首先,理解HP...

Global site tag (gtag.js) - Google Analytics