`

c++ 读取unicode文档

    博客分类:
  • c++
 
阅读更多
int ReadOneNameFile(char *filename, unsigned short names[g_maxLineNum][g_maxCharInLine], int &iLine)
{
	printf("%s\n", filename);
	ifstream fin;  
	fin.open(filename, ios::binary);  
	size_t index = 2;
	int nameIndex = 0;
	//while (!fin.eof())  //注意这行如果是这行代码,最后读取出来的数据最后一个字符会多一个,
	while (fin.peek() != EOF)
	{
		fin.seekg(index, ios::beg);  
		wchar_t wch;  
		fin.read((char *)(&wch), 2);
		if (wch == 0x000D) // 判断回车  
		{ 
			iLine++; 
			if (iLine > g_maxLineNum)
			{
				fin.close();
				return 0;
			}
			nameIndex = 0;
			index += 4; // 跳过回车符和行开头符  
		}  
		else  
		{  
			names[iLine][nameIndex] = wch;
			index += 2; 
			nameIndex++;
		}  
	}

	if (nameIndex > 0)
	{
		iLine++;
	}
	fin.close();
	return 0;
}
分享到:
评论

相关推荐

    如何通过VC++直接读取复合文档属性

    "通过VC++读取复合文档属性" 在 Windows 操作系统中,复合文档是指包含多种数据类型的文档,例如文本、图片、音频、视频等。这些数据类型可以是简单的数据类型,也可以是复杂的数据结构。为了读取这些复合文档的...

    C++编写的文档分析器

    2. 字符编码:不同的文档可能使用不同的字符编码,如ASCII、UTF-8、Unicode等。理解这些编码系统并正确处理字符转换是文档分析的基础。 3. 正则表达式:C++标准库虽然不直接支持正则表达式,但可以借助第三方库如...

    VC++ 读写Excel VS2012(Unicode版)

    在本文中,我们将深入探讨如何使用Visual C++ (VC++) 版本2012进行Excel的读写操作,特别是针对Unicode编码环境的实现。Unicode是一种国际标准,它支持全球几乎所有的字符集,使得跨语言的编程变得更为简单。在VS...

    用C++编写的TXT文档的字符合法性检测

    在C++编程中,字符合法性检测是常见的任务之一,特别是在处理文本文件时,如TXT文档。这个任务的主要目的是确保文件中的字符符合特定的规范或标准,例如ASCII字符集、Unicode字符集,或者是用户自定义的合法字符域。...

    很好的C++读XML示例

    总的来说,C++与XML的交互是通过MSXML2 SDK提供的接口完成的,这些接口允许我们对XML文档进行读取、查询、修改和保存。通过熟练掌握这些接口和方法,你可以构建出强大的XML处理程序,实现各种复杂的XML数据操作。在...

    C++编程实现提取RTF写字板中的文本

    1. **文件读取**:使用C++的`fstream`库打开并读取RTF文件。例如,可以创建一个`ifstream`对象,并使用`open()`函数打开文件,然后通过`getline()`或`read()`方法逐行读取内容。 2. **预处理**:由于RTF文件包含...

    读取BMP文件的C++程序.pdf

    本程序展示了如何使用C++读取一个BMP文件,特别是“cameraman.bmp”,这是一个256×256×256色的黑白图像。在深入程序细节之前,我们先了解一下BMP文件的基本结构。 BMP文件通常由两个主要部分组成:位图文件头...

    Unicode MBCS字符转换程序.rar

    在IT领域,字符编码是一个非常重要的主题,尤其是在处理多语言文本时。..."字符转换程序总结.docx"可能是项目文档,详细记录了程序的设计思路、实现方法和使用教程,对于深入理解该项目非常有帮助。

    Unicode_test.rar_unicode

    这个测试程序可能是为了演示如何在不同的编程环境中正确地读取、写入和显示Unicode字符。 **Unicode编码简介** Unicode,又称为UCS(Universal Character Set),是一个庞大的字符集,包含了世界上几乎所有的文字...

    GBK转UNICODE+点阵显示

    2. 将GBK编码的字符串转换为UNICODE编码,可以使用库函数如Windows API的MultiByteToWideChar,或者C++的locale和codecvt类。 3. 对转换后的UNICODE字符串进行24*24点阵的生成,这通常涉及到字符形状的查找表和位图...

    MFC读取utf8示例

    在IT行业中,MFC(Microsoft Foundation Classes)是一个C++库,由微软开发,用于构建Windows应用程序。MFC提供了丰富的类库,使得开发者可以方便地利用Windows API进行编程。本示例主要关注的是如何在MFC环境中读取...

    C++二维码解析,支持中文

    QBar库是一个专门用于读取和生成二维码的C++库,它提供了方便的API供开发者使用。 要使用QBar库,首先需要将其安装到你的开发环境中。对于VS2017,可以通过下载QBar源代码并按照官方文档的指示进行编译和配置。完成...

    使用C++处理XML

    本主题将专注于如何使用C++来处理XML文档,特别强调支持中文字符。 在C++中处理XML,我们通常需要依赖第三方库,因为C++标准库并不直接提供XML解析功能。在提供的标签“LibXML2”中,我们可以找到一个强大的开源XML...

    文件格式转换工具

    在IT行业中,文件格式转换是常见的需求,尤其是在数据交换、文档处理或多媒体应用等领域。"文件格式转换工具"就是这样一个应用程序,它允许用户将文件从一种格式转换为另一种。在这个项目中,我们看到使用了QT框架来...

    创建txt文档并向里面写入内容

    在IT行业中,文本处理是一项基础且重要的任务,而创建和操作TXT文档是其中最常见的一环。本主题将深入探讨如何使用编程语言来创建TXT文件并写入内容,以及后续如何打开并读取这些内容。这里我们将以Python作为示例...

    xml.rar_UTF8 unicode_c xml_unicode 文件_xml unicode_xml utf8

    C++中的“xml.cpp”和“xml.h”文件可能包含了一个XML解析器或处理库,用于读取、写入和操作XML文档。这些文件可能定义了类和函数,帮助开发者方便地处理XML结构,例如创建XML节点、添加属性、遍历XML树等。通常,...

    JsonCpp解析\u中文乱码_修改源码_完美解决

    JsonCpp是一个开源库,它为C++提供了处理JSON的工具,支持读写JSON文档以及与C++对象之间的转换。然而,在处理包含中文字符的JSON数据时,JsonCpp可能会遇到乱码问题,这是由于编码不兼容或者处理方式不当导致的。 ...

    查询IE Cookie C++

    4. **获取Document对象**:通过`IWebBrowser2::Document`属性,可以获取当前加载页面的`IDispatch`接口,然后可以转换为`IHTMLDocument2`接口,这是HTML文档的接口,允许我们访问DOM(文档对象模型)。 5. **遍历...

    C/C++语言UTF16和UTF32互相转换生成文件

    本篇文章将深入探讨如何使用C/C++进行UTF-16和UTF-32之间的转换,并讨论在读取和写入文件时的相关技术。 首先,让我们理解UTF-16和UTF-32的基本概念。UTF-16使用16位(2个字节)的单位来编码大多数常见的Unicode...

    c++ pdflib 输出中文字体完整代码

    在C++编程中,生成PDF文件是一项常见的任务,特别是在文档处理和报告生成的场景下。PDFLib是一个强大的库,它允许程序员通过API接口创建、编辑和显示PDF文档。在这个项目中,我们专注于如何在PDFLib中实现中文字体的...

Global site tag (gtag.js) - Google Analytics