package com.test;
import java.io.UnsupportedEncodingException;
public class byteCountTest {
public static void printByteCount(String str , String encoding) {
int length = 0;
try {
length = str.getBytes(encoding).length;
} catch (UnsupportedEncodingException e) {
length = 0;
}
System.out.println(encoding + " : " + length);
}
public static void main(String[] args) {
String en = "A";
String ch = "人";
printByteCount(en, "GB2312");
printByteCount(en, "GBK");
printByteCount(en, "GB18030");
printByteCount(en, "ISO-8859-1");
printByteCount(en, "UTF-8");
printByteCount(en, "UTF-16");
printByteCount(en, "UTF-16BE");
printByteCount(en, "UTF-16LE");
System.out.println("-------------------------");
printByteCount(ch, "GB2312");
printByteCount(ch, "GBK");
printByteCount(ch, "GB18030");
printByteCount(ch, "ISO-8859-1");
printByteCount(ch, "UTF-8");
printByteCount(ch, "UTF-16");
printByteCount(ch, "UTF-16BE");
printByteCount(ch, "UTF-16LE");
}
}
结果:
GB2312 : 1
GBK : 1
GB18030 : 1
ISO-8859-1 : 1
UTF-8 : 1
UTF-16 : 4
UTF-16BE : 2
UTF-16LE : 2
-------------------------
GB2312 : 2
GBK : 2
GB18030 : 2
ISO-8859-1 : 1
UTF-8 : 3
UTF-16 : 4
UTF-16BE : 2
UTF-16LE : 2
分享到:
相关推荐
中文字符在Java中所占用的字节数并不固定,它取决于所采用的字符编码方式。这是因为不同的编码标准有不同的字符表示机制,从而导致了字节数的不同。 首先,ISO8859-1是一种西欧字符编码,它只支持拉丁字母,不包含...
例如,如果使用UTF-8编码,一个中文字符可能占用3个或4个字节,而英文字符只占1个字节。因此,如果我们想要根据字节数截取字符串,我们不能简单地用`substring()`,而是需要先计算字符串的字节数,然后根据这个字节...
由于中文字符在不同的编码方式下所占的字节数不同,因此计算中文字符的字节数需要考虑其具体的编码格式。例如,在UTF-8编码中,可以使用正则表达式来匹配非ASCII字符,并将其替换为特定的字符串(如题目中的"aa"),...
这些示例展示了如何在不同编程语言中计算字符串的字节数,但要注意,对于包含多字节字符(如UTF-8中的非ASCII字符)的字符串,字节数会根据编码方式变化。因此,当你进行数据传输或存储时,了解字符串的编码和字节数...
VC 6.0 统计字符串中英文字符个数,统计时将判断中英文字符个数,分别统计有多少个字符: UpdateData(TRUE); //获得字符串按字节数计算的长度 int Lenth = m_strTxt.GetLength(); int nELenth = 0;//英文...
在这段关于JavaScript验证控制输入中英文字节长度的示例中,我们可以学到如何使用JavaScript脚本来检测用户输入的字符长度...同时,了解不同语言字符所占字节的不同,有助于我们更准确地控制和优化文本输入的验证逻辑。
在 Word 文档编辑过程中,空格间隔大小和每个空格所占的字符数是两个重要的概念。调整空格间隔大小可以改变文档的布局和美观性,而每个空格所占的字符数则会影响文档的排版和阅读体验。 什么是空格间隔大小? -----...
示例代码中定义了`u8_title_substr`函数,通过循环遍历字符串中的每个字符,根据字符的编码类型(1、2、3或4字节)累加相应的权重值,最终实现了等宽度截取UTF-8编码的中英文字符的功能。 #### 五、注意事项 - 在...
《中英文字符分离程序》是基于VC6.0开发的一款实用工具,主要功能是对TXT文本文件中的中英文字符进行智能分离,生成两个独立的文本文档,分别存储中文字符和英文字符。这一程序的核心在于对字符串及字符的精确处理,...
"统计字符串中英文标点数量并截取.zip"的文件提供了针对这种情况的一个解决方案。这个压缩包内包含的可能是Java代码示例(如csdn-demo),用于批量处理字符串,统计其中的中英文标点符号的数量,并根据指定的字符...
综上所述,对于中英文混合字符串的长度计算,有多种方法可以实现。其中,自定义循环计算法适用于需要详细了解内部逻辑的场景;而使用`lstrlen`或`StrConv`结合`LenB`的方法则更加简洁高效,尤其适合需要快速处理大量...
由于中文字符通常占用两个字节(这里指一个汉字占两个字符位置),而英文字符只占用一个字节,所以在处理这类问题时,我们需要特别注意字符的编码方式。本文介绍了一个能够区分中英文字符的`Left`函数实现方法,主要...
由于一个中文字符通常占用两个字节的空间,而英文字符只占一个字节,因此在限制字节数时需要考虑到这一点。这种需求常见于表单验证、数据库存储前的数据预处理等场景。 #### 二、核心功能与实现原理 给定的代码实现...
js计算字符串长度,可以输入中文、英文、数字、中英文数字混合等,最后计算结果为字符串所占字节个数
js虽然提供了计算字符串所占字节数的函数,但是却不能正确计算汉字所占的字节数,如document.form1.username.value=“我是中国人”,document.form1.username.value.length返回的是5而不是10,于是给编程时带来一些...
《中英文字符编码查询_V1.1》是一个实用的工具,主要用于帮助用户理解和查询中英文字符的编码方式。字符编码是计算机科学中的一个重要概念,它关乎到如何在计算机内部存储和处理文字信息。本工具主要关注的是Unicode...
- 占两个字节,可以存储Unicode编码表中的字符,包括英文字符、数字和汉字等。 ##### 8. Boolean类型 - **字节长度**:1/8字节(1位) - **取值范围**:true/false - **应用场景**: - 用于逻辑运算。 - 在条件...
英文字符通常占一个字节,而中文字符占两个字节。在处理定长分行时,需要考虑字符宽度,英文字符和中文字符的宽度可能不同。 2. **字符串处理**:VC++中,我们可以使用`std::string`或者`CString`类来操作字符串。...
因此,在限制输入长度时,需要考虑到不同字符类型所占的不同字节数。 #### 二、核心功能 本文将详细介绍一个用于限制文本字节数的JavaScript函数`limitLength`。该函数旨在帮助开发者轻松地在网页表单中实现字节数...
在UTF-8编码中,英文字符占1个字节,而汉字通常占2个字节。因此,为了限制输入的字节数,我们需要自定义处理方法。 首先,我们可以使用`UITextField`的代理方法来监听用户输入的变化。但是,`textField:...