`
aigo
  • 浏览: 2698798 次
  • 性别: Icon_minigender_1
  • 来自: 宜昌
社区版块
存档分类
最新评论

CFile、File读写UTF8

 
阅读更多
CString CSocketClientDlg::GotFile(CString filename)
{
    CFile fileR;
    CString strFile="";
    if(!fileR.Open(filename,CFile::modeRead|CFile::typeBinary))
    {
        return strFile;
    }
    BYTE head[3];
    fileR.Read(head,3);
    if(!(head[0]==0xEF && head[1]==0xBB && head[2]==0xBF))
    {
        fileR.SeekToBegin();
    }
    ULONGLONG FileSize=fileR.GetLength();
    char* pContent=(char*)calloc(FileSize+1,sizeof(char));
    fileR.Read(pContent,FileSize);
    fileR.Close();
    int n=MultiByteToWideChar(CP_UTF8,0,pContent,FileSize+1,NULL,0);
    wchar_t* pWideChar=(wchar_t*)calloc(n+1,sizeof(wchar_t));
    MultiByteToWideChar(CP_UTF8,0,pContent,FileSize+1,pWideChar,n);
    strFile=CString(pWideChar);
    free(pContent);
    free(pWideChar);

    return strFile;
}

void write_utf8()  
{  
    FILE* fp = fopen("test.txt", "wb+");  
  
    // 写入UTF-8的BOM文件头  
    char header[3] = {(char)0xEF, (char)0xBB, (char)0xBF};  
    fwrite(header, sizeof(char), 3, fp);  
  
    char* s = "hello, 你好!";  
    wchar_t wc[256];  
    // 将ANSI编码的多字节字符串转换成宽字符字符串  
    int n = MultiByteToWideChar(CP_ACP, 0, s, strlen(s), wc, 256);  
    if ( n > 0 )  
    {  
        wc[n] = 0;  
  
        char mb[1024];  
        // 将宽字符字符串转换成UTF-8编码的多字节字符串  
        n = WideCharToMultiByte(CP_UTF8, 0, wc, wcslen(wc), mb, 1024, NULL, NULL);  
        if ( n > 0 )  
        {  
            mb[n] = 0;  
            fwrite(mb, sizeof(char), strlen(mb), fp);  
        }  
    }  
  
    fclose(fp);  
} 

 

分享到:
评论

相关推荐

    ANSI文件转UTF-8

    int u8Len = ::WideCharToMultiByte(CP_UTF8, NULL, wszString, wcslen(wszString), NULL, 0, NULL, NULL); char* szU8 = new char[u8Len + 1]; ::WideCharToMultiByte(CP_UTF8, NULL, wszString, wcslen(wszString...

    c++ 读写txt文件和乱码问题解决

    然而,对于简单的读写操作,一个实用的方法是使用`wstring`(宽字符串)和`std::codecvt_utf8`: ```cpp #include #include #include #include int main() { std::locale loc(std::locale(), new std::...

    VC++按行读取txt.zip

    例如,使用`std::wstring_convert`和`std::codecvt_utf8`可以处理UTF-8编码: ```cpp std::ifstream file("example.txt", std::ios::binary); std::wstring_convert<std::codecvt_utf8_utf16<wchar_t>> converter...

    ini文件操作类,封装了对ini文件的创建、读写等操作

    1. 文件路径和编码:确保正确指定文件路径,并理解文件的编码方式,如ASCII或UTF-8。 2. 错误处理:捕获可能出现的异常,确保程序在遇到问题时能优雅地处理。 3. 性能优化:如果读写频繁,考虑缓存ini文件内容以减少...

    基于MFC打开TXT文档

    在Windows编程环境中,Microsoft ...在实际项目中,可能还需要考虑编码问题,如UTF-8或GBK编码,以及对不同操作系统下的路径兼容性等问题。通过熟练掌握这些基础知识,你可以轻松地在MFC应用程序中处理文本文件。

    C# FileStream 分段读取文本内容

    string readText = Encoding.UTF8.GetString(buffer, 0, bytesRead); Console.WriteLine(readText); // 输出读取的文本 } ``` 这里,我们使用了UTF-8编码将字节数组转换为字符串。如果你的文件使用其他编码,如...

    c++文件控件

    文件读写时需考虑字符编码问题,如ASCII、UTF-8等。根据文件类型,可能需要进行编码转换。 10. **安全性和权限** 在进行文件操作时,应检查用户权限,并确保操作的安全性,防止文件被恶意修改或访问。 通过以上...

    使用VC读取文件写到编辑框中

    - 对于非文本文件,还需要考虑编码问题,例如UTF-8、GBK等。 通过以上步骤,我们可以在VC++应用程序中实现从文件读取数据并显示到编辑框的功能。这不仅适用于简单的文本编辑器,也可以作为更大规模应用程序的基础...

    文档格式化为指定长度(包括中文字符)mfc

    `CFile`是基本的文件操作类,而`CStdioFile`是基于标准I/O库的扩展,更适合读写文本文件。下面是一个简单的例子,展示了如何使用MFC读取文件内容并进行格式化: ```cpp #include #include using namespace std; ...

    C语言源代码格式化 完工 V1.04 20120226 1946.7z

    原理:ASC(转换) 转 UNICODE 转 UTF-8。 处理文件夹。 SubtitleENCN 20110726 1924.7z 剔除中英文字幕中的中文。 原理:ASC 转 UNICODE(剔除中文) 回转ASC。 StringArrayBuildX10排版完成 20110728 0853...

    C语言源代码格式化 完工 V1.09 20120821 2116.7z

    说明: 除非特别声明,所有程序均使用VC++6.0 MFC编写。 所有程序均为练手用,放弃一切权利,同时不承担任何责任。...UTF8 转 UNICODE 转 ANSI之后进行处理,处理完之后,ANSI 转 UNICODE 转 UTF-8 保存。 处理子目录

    C语言源代码格式化 完工 小文版本 V1.10 20120831 0955.zip

    UTF8 转 UNICODE 转 ANSI之后进行处理,处理完之后,ANSI 转 UNICODE 转 UTF-8 保存。 处理子目录 A2DA 20120831 0939.7z DA2A 20120831 0939.7z 功能:单文件处理,WINDOWS/LINUX下的回车换行的处理。

    C语言源代码格式化 完工 V1.05 20120229 1804.7z

    原理:ASC(转换) 转 UNICODE 转 UTF-8。 处理文件夹。 SubtitleENCN 20110726 1924.7z 剔除中英文字幕中的中文。 原理:ASC 转 UNICODE(剔除中文) 回转ASC。 StringArrayBuildX10排版完成 20110728 0853...

    C语言源代码格式化 完工 V1.03 20120112 1536.7z

    原理:ASC(转换) 转 UNICODE 转 UTF-8。 处理文件夹。 SubtitleENCN 20110726 1924.7z 剔除中英文字幕中的中文。 原理:ASC 转 UNICODE(剔除中文) 回转ASC。 StringArrayBuildX10排版完成 20110728 0853...

    C语言源代码格式化 完工 V1.08 20120801 1627.7z

    原理:ASC(转换) 转 UNICODE 转 UTF-8。 处理子目录 SubtitleENCN 20110726 1924.7z 剔除中英文字幕中的中文。 原理:ASC 转 UNICODE(剔除中文) 回转ASC。 StringArrayBuildX10排版完成 20110728 0853.7...

Global site tag (gtag.js) - Google Analytics