实现不通过码表进行中文简体与中文繁转换,还包括GB内码与BIG5内码转换函数
gb2312 gbk 编码表 包括 gb码表 gbk码表 gbk纯字符集 以及一份汉字编码的介绍
Big5码 转 GBK 内码 VC工程 程序
这是一个由中文转换为汉字编码的软件,可作为一个小工具使用
gb18030所有字符集与码表,表
Windows系統的代码页,BestFit格式的,各種文字轉UNICODE的對應碼錶。很有價值。
汉字内码是为计算机内部对汉字进行存储.处理的汉字代码,它应能满足存储.处理和传输的要求.当一个汉字输入计算机后就会转换为内码,然后才能在机器内传输.处理.汉字内码的形式也有多种多样.目前,对应于国标码一个汉字也用2个字节存储,并把每个字节的最高二进制位置"1"作为汉字内码的表识,以免与单字节的ASCII码产生歧义性.
『小鸭五笔』是一款以五笔为主的中文输入法软件,并提供了拼音辅助输入功能。支持GB18030标准 (可输入GBK字符集21004字及CJK-A扩充区6582字)。为初学五笔的朋友提供突出显示简码字的功能。支持打简出繁,支持简->繁体非对称转换。支持拼音、五笔编码双向反查。支持在线造词、删词。支持手动、自动调频。提供方便的修改、替换词库的方法。支持定制常用字表、减少录入时重码率,以提高录入效率。提供多种重码排序方案,允许动态切换。支持三重二级简码(可定制)。支持多用户环境,配置文件与Windows登录用户同步切换,以保存多用户环境中个人的使用习惯。提供了多套不同风格的配色方案。
汉字内码查询 反查询
汉字编码方法的实现,此程序能够实现对汉字的编码和解码
本系统具备中文自动分词、全文检索、统计等基本功能,具体介绍如下: 1、中文自动分词 1)能对给定的中文文本进行自动分词、词性一级、词性二级标注; 2)支持大批量文本的自动分词及词性标注处理,可处理各级子文件夹下的文件; 3)能根据待分词及标注文本的类别,加挂用户自定义词典,进一步提高分词和标注的精确度; 4)用户可对系统词典进行扩展,可添加、删除、查看系统词典,可将系统词典输出为TXT文本编辑后再转换为系统用的电子词典; 5)支持人名、地名、机构名等未登录词识别,支持基于GBK字符集的简、繁体文本的处理。 2、全文检索 1)能对给定的大批量文本分别建立基于字、词、词及词性的三种索引库; 2)打开相应的索引库后,可进行字串、词串、词及词性串的全文检索; 3)能显示检索结果的出处,点击后可自动打开对应的文本,进行具体的查阅; 4)支持语言学属性的全文检索,可控制检索串中字串的前后搭配及范围; 5)能控制检索结果中关键字串前后显示的字数并对结果中的查询关键字串以红色或蓝色显示。 3、统计 1)可对大批量文本进行字频、词频统计,可处理各级子文件夹下的文件; 2)对统计结果,提供基于字符码表、频率、拼音、部首四种方式的排序显示; 3)能对指定文件夹及子文件夹下的所有的TXT文本文件进行词频统计(对未分词文本可边自动分词边统计或对已分词并经人工校对的文本进行词频统计); 4)词频统计对象不是基于词表的词才统计,而是将分词结果中所有的词进行词频统计; 5)可对统计、检索结果进行编辑并保存为TXT或RTF格式的文件。
标准编码的码表,包括UTF8,unicode,GB2312-80,big5等等。
本程序实现了两个功能:(1)汉字和区位码之间的转换(2)汉字简体和繁体间的转换
取自全国信息技术标准化技术委员会,包括全部汉字以及符号,供编程以及对GBK感兴趣的人研究、学习、使用
批量更改文件名为简体.rar
unicode与GB18030(GB2312,GBK) 转换码表
gbk unicode utf8 big5编码表
有关编码的知识及各国语言的编码表,包括windows1251-1258,GB2312,GBK,BIG5,ASCII码表
提出并实现一个简繁体字型互相转换的程序。其主要目的是建立GBK与BIG5内码码表对应文件,可以自行修改对应关系。另外在此基础上可以实现GBK字与BIG5字的即时转换,文本文件,ACCESS数据库文件,EXCEL文件的简繁体互相转换。作为此程序的延伸功能,如果开发三层结构程序,可以用此功能实现简繁通用程序。