`
dananhai
  • 浏览: 91567 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

转 汉字问题

    博客分类:
  • java
阅读更多
如何实现汉字转化
 
如果要支持国际化,那么页面的编码必须为UTF-8,因为客户端的浏览器都支持UTF-8编码。
下面做个简单的测试:
建立一个html文件,内容很简单,如下
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</HEAD>
<BODY>
这是一个中文字符串<BR>
这是一个中文字符串
</BODY>
</HTML>
以上代码保存后,在IE中打开,你可以看到
这是一个中文字符串
Β???
第二行显示的可能不同机器显示不一样,但是应该都是乱码。
下面进行第二步,返回刚才的页面,修改浏览器的编码方式,可以看得到
无论怎么改变编码方式,第一行永远现实的是“这是一个中文字符串”,只有在编码方式为简体中文的时候,第二行才不显示乱码。
所以,如果要你的web站点支持国际化,那么除了编码方式要为UTF-8,而且页面中的中文部分(包括中文的标点符号)都要经过UNICODE编码。
UTF-8编码工具:
方法一:     JDK的native2ascii工具
   
native2ascii-本地码-至-ASCII 码转换器

将含有本地编码字符(既非 Latin1 又非 Unicode 字符)的文件转换为 Unicode 编码字符的文件。

结构
native2ascii [options] [inputfile [outputfile]]

说明
Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码(\udddd 记号)字符的文件。native2ascii 将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件。

若省略 outputfile,则使用标准输出设备输出。此外,如果也省略 inputfile,则使用标准输入设备输入。


选项
-reverse
执行相反的操作:将含 Latin-1 和/或 Unicode 编码字符的文件转换成含本地编码字符的文件:

-encoding encoding_name
指定转换过程使用的编码名称。缺省的编码从系统属性 file.encoding 中得到。encoding_name 字符串必须是符合要求的字符串。


比如可以这样利用native2ascii:
native2ascii -encoding gbk application_zh_CN.properties  temp.properties
  这里将根据application_zh_CN.properties输出了一个临时文件temp.properties,然后把application_zh_CN.properties中的文件内容替换为这个临时文件的内容就可以了。

转换后的application_zh_CN.properties 
# Hello\u5b9e\u4f8b\u4f7f\u7528\u7684\u8d44\u6e90\u6587\u4ef6
 
hello.title=\u7b2c\u4e00\u4e2aStruts\u5e94\u7528
hello.prompt.user=\u8bf7\u8f93\u5165\u7528\u6237\u540d
hello.page.hello=\u4f60\u597d
hello.page.wellocome=\u6b22\u8fce\u6765\u5230Javamxj\u7684Blog


  这样的操作对于一个或两个资源文件还行,如果多个资源文件,这样未免有些太麻烦了。你可以建立一个批处理文件(.bat);或者建立一个Ant文件,利用其包含的native2ascii任务,也可以进行批处理。

方法二:     UTF-8 转换工具,这是一个JS脚本,保存后可以对输入的字符串进行转换,代码如下


<html> 
<head> 
<title>UTF8 转换工具</title> 
<div align=center> 
  <center> 
  <table border=0 cellpadding=0 cellspacing=0 style="border-collapse: collapse" width=600 id=AutoNumber1 height=26> 
    <tr> 
      <td width=100% height=26> 
      <p align=center><font face=黑体 size=5 color=#FF0000>UTF-8 转换工具</font></p> 
      <p>使用方法:</p> 
      <p>  在下面的文本框中输入中文文字,按“转化”,即可将其转化为UTF-8字符。</p> 
      <p>  再按“还原”,即可将其还原为简体中文。</td> 
    </tr> 
  </table> 
  </center> 
</div> 
<p align=center> 
<textarea cols=82 rows=10 id=code> 
</textarea> </p> 
<p align=center> 
<input type=button onclick=encode(code,this) value=转化> 
<script> 
var mode="zhuan";  
function encode(obj,btn){  
if(mode=="zhuan"){  
  obj.value=obj.value.replace(/[^\u0000-\u00FF]/g,function($0){return escape($0).replace(/(%u)(\w{4})/gi,"&#x$2;")});  
  btn.value="还原";  
  mode="huan";  
}else{  
  obj.value=unescape(obj.value.replace(/&#x/g,'%u').replace(/;/g,''));  
  btn.value="转化";  
  mode="zhuan";  
}  
}  
</script></p> 
分享到:
评论

相关推荐

    C++中文汉字转拼音

    本项目名为"C++中文汉字转拼音",旨在利用C++编程实现一个高效、灵活的汉字转拼音功能。 项目的核心在于使用"拼音-中文"的数据字典。这种设计思路是预先建立一个包含所有汉字及其对应拼音的映射关系,通常以文本...

    GBK编码转换汉字,汉字转换GBK编码,VC代码实现

    GBK编码是GB2312编码的扩展,用于表示更多的汉字和符号,是简体中文环境下广泛使用的一种字符编码。VC++,作为Microsoft的C++开发环境,提供了丰富的库支持来处理这种编码转换。本篇文章将深入探讨如何在VC++环境中...

    C#汉字转拼音(npinyin)将中文转换成拼音全文或首字母

    例如,如果一个程序需要对中文字符进行排序,或者在没有输入法的情况下通过英文键盘输入中文,汉字转拼音就显得尤为重要。 "C#汉字转拼音(npinyin)"是一个C#库,它提供了一个方便的方式来将汉字转换为对应的汉语...

    十六进制转汉字

    十六进制转汉字的过程涉及到以下几个关键步骤: 1. **解析输入**:程序接收用户输入的汉字或16进制串。 2. **确定编码**:根据用户选择的字符编码标准(如GBK、GB2312、UTF-8等)来处理数据。 3. **转换**:如果输入...

    汉字中文十六进制显示转换

    综上所述,“汉字中文十六进制显示转换”是一个涉及字符编码、数据转换和串口通信的综合问题。理解并掌握这些概念和方法对于进行跨平台、多语言的软件开发至关重要。在实际工作中,我们不仅要理解理论,还要熟练运用...

    汉字与GBK内码互转工具(支持批量转换)

    汉字与GBK内码的转换主要包括两个过程:汉字转GBK内码和GBK内码转汉字。 1. 汉字转GBK内码: 这个过程通常涉及到查表操作。根据预先定义的GBK编码表,输入的汉字可以通过查找其对应的GBK编码,得到相应的两个字节...

    Unicode码转中文和中文转Unicode码的最简便的方法

    中文转Unicode码和Unicode码转中文的过程在Java环境下可以通过`native2ascii`工具轻松实现,这个工具是Java开发工具包(JDK)的一部分。 **中文转Unicode码**: 1. 首先,你需要确保已经安装了Java JDK。JDK包含了...

    中文汉字转拼音

    在IT领域,中文汉字转拼音是一项重要的技术,特别是在处理中文数据、搜索引擎优化(SEO)、语音合成、自动文本处理等方面有着广泛的应用。PHP作为一款流行的服务器端脚本语言,提供了多种方法来实现这一功能。本文将...

    C# 将中文乱码转换成中文

    当我们在不同的系统或网络环境中传输或存储文本时,可能会遇到字符编码不一致导致的中文乱码问题。本文将深入探讨如何使用C#语言解决中文乱码问题,将乱码文本正确转换为可读的中文。 ### 核心知识点:字符编码与...

    汉字转拼音_汉字转拼音Excel_

    在Stata中,由于其内建函数可能不支持汉字,所以预先将汉字转成拼音可以解决这个问题。 在“汉字转拼音.txt”这个文件中,可能包含了一段VBA代码,这段代码的功能是读取Excel单元格中的汉字,然后将其转换为对应的...

    中文汉字转unicode工具

    中文汉字转 Unicode 工具,正如其名,是一种能够将中文汉字转换为 Unicode 编码的实用程序。这类工具通常有以下功能: 1. **输入转换**:用户可以输入或粘贴包含中文汉字的文本,工具会自动将其转换为相应的 ...

    汉字转平假名工具

    汉字转平假名工具是一种专门用于将汉字转化为日文平假名的软件应用。在学习和使用日语的过程中,理解并正确书写平假名是非常基础且重要的一步。平假名是日语三种表音文字(假名)之一,由简化后的汉字草书演变而来,...

    汉字转16进制工具

    - **GBK编码**:GBK是针对简体中文的扩展ASCII编码,它兼容GB2312,包含20902个汉字,采用双字节编码。 - **UTF-8编码**:UTF-8是最常见的Unicode实现方式,它可以以1到4个字节的长度编码任何Unicode字符,对于...

    易语言汉字转拼音

    汉字转拼音是计算机处理中文时的一项常见任务,它可以应用于各种场景,如语音输入、搜索优化、文本分析等。易语言通过内置的API或自定义模块,可以实现这一功能。下面我们将详细介绍如何在易语言中实现汉字转拼音。 ...

    汉字编码转换为字节码工具

    总的来说,"汉字编码转换为字节码工具"是计算机处理汉字字符的关键技术之一,它简化了编码转换的过程,提高了工作效率,并且对于理解和解决与汉字编码相关的各种问题具有重要意义。通过深入学习和熟练运用这类工具,...

    易语言汉字和ASCII码之间的转换

    2. **ASCII转汉字**:将ASCII码转换回汉字的过程相对复杂。由于ASCII码只能表示128个字符,不能直接表示汉字,所以需要将ASCII码组合成更大的编码(如GBK或UTF-8的编码单元)来还原汉字。这个过程通常需要知道输入...

    java txt转换pdf 解决中文问题

    本篇文章将详细探讨如何使用Java将TXT文本文件转换为PDF,并解决中文字符显示问题。 首先,我们需要理解TXT和PDF这两种文件格式。TXT文件是最基本的纯文本格式,不包含任何格式化信息,而PDF(Portable Document ...

    JavaScript中文转拼音,JS中文转拼音插件,中文转拼音(JavaScript)

    标题提到的“JavaScript中文转拼音”就是一种这样的技术,它允许开发者将中文字符串转化为拼音形式,以便于程序处理。 描述中提到,这个压缩包内包含了一个已经开发和测试完成的JS中文转拼音插件,文件包括"pyClass...

    asp拼音转汉字

    总的来说,"asp拼音转汉字"是一个结合了ASP编程、数据库操作和中文处理技术的综合问题。通过理解这些基础知识,开发者可以构建出能够处理拼音到汉字转换的应用,从而满足用户在不同场景下的需求。

    汉字转拼音C++源代码

    汉字转拼音是将中文汉字转化为对应的汉语拼音的过程。在计算机处理中文时,由于计算机内部主要处理ASCII编码,而汉字属于Unicode或GBK等多字节编码,因此需要将汉字转换为拼音以便进行进一步的处理。这个转换过程...

Global site tag (gtag.js) - Google Analytics