import java.io.UnsupportedEncodingException;
public class StringUtil {
public static String subString(String text, int length, String endWith) {
int textLength = text.length();
int byteLength = 0;
StringBuffer returnStr = new StringBuffer();
for(int i = 0; i<textLength && byteLength < length*2; i++){
String str_i = text.substring(i, i+1);
if(str_i.getBytes().length == 1){//英文
byteLength++;
}else{//中文
byteLength += 2 ;
}
returnStr.append(str_i);
}
try {
if(byteLength<text.getBytes("GBK").length){//getBytes("GBK")每个汉字长2,getBytes("UTF-8")每个汉字长度为3
returnStr.append(endWith);
}
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return returnStr.toString();
}
测试:
public static void main(String[] args) {
String text = "。发.。篇>所q阿s似hf的f**发千万s";
for(int i = 0; i< text.length();i++){
String s = StringUtil.subString(text,i+1,"...");
System.out.println(s+"--------------------------"+(i+1));
}
}
结果:
。...--------------------------1
。发...--------------------------2
。发.。...--------------------------3
。发.。篇...--------------------------4
。发.。篇>...--------------------------5
。发.。篇>所...--------------------------6
。发.。篇>所q阿...--------------------------7
。发.。篇>所q阿s...--------------------------8
。发.。篇>所q阿s似...--------------------------9
。发.。篇>所q阿s似hf...--------------------------10
。发.。篇>所q阿s似hf的...--------------------------11
。发.。篇>所q阿s似hf的f*...--------------------------12
。发.。篇>所q阿s似hf的f**...--------------------------13
。发.。篇>所q阿s似hf的f**发...--------------------------14
。发.。篇>所q阿s似hf的f**发千...--------------------------15
。发.。篇>所q阿s似hf的f**发千万...--------------------------16
。发.。篇>所q阿s似hf的f**发千万s--------------------------17
。发.。篇>所q阿s似hf的f**发千万s--------------------------18
。发.。篇>所q阿s似hf的f**发千万s--------------------------19
。发.。篇>所q阿s似hf的f**发千万s--------------------------20
。发.。篇>所q阿s似hf的f**发千万s--------------------------21
结果分析:
当截取后的字符串里面有奇数个英文字符,且最后一个是中文字符,这时会多出半个汉字长度
当截取后的字符串里面有偶数个英文字符,且最后一个是英文字符,这时会少出半个汉字长度
这是正常的
分享到:
相关推荐
总结来说,Java截取中英文混合字符串的方法需要综合考虑编码方式和汉字占用字节长度的问题,并且需要采取适当的技术手段来确保汉字不会被截断。通过自定义截取方法,并在截取过程中正确地使用编码方式,我们可以有效...
这种方法主要用于解决在 Java 中截取字符串时遇到的问题,即在截取中英文混合字符串时如何避免汉字被截半个。 在 Java 中,字符串是以 Unicode 编码方式存储的,每个字符占用 2 个字节。因此,在截取字符串时需要...
这个方法用来处理java中可能有一些特别的需要,一大串中英文混合,需要中间截断或是中英中间添加一些特别的标识,调用这个方法 第一个参数是要处理的字符串,第二个是要在中英字符中间插入的字符。调用就可以得到想...
因此,当在Java程序中处理包含中英文混合的字符串时,必须考虑到编码差异,以避免截取错误或乱码的出现。 ### 实践应用 在实际开发中,特别是在Web开发、文本分析等领域,正确处理多语言字符串是非常关键的。使用...
在Java编程中,有时我们需要对字符串进行精确截取,以便适应特定的需求,比如在网页显示、数据存储或者传输时限制长度。本篇将探讨如何在Java中实现这一功能。 首先,最常见的一种方法是使用`substring()`方法。...
在Java中,处理字符串是非常常见且重要的任务之一,尤其是在涉及到国际化应用时,如何高效准确地处理中英文混合的字符串就显得尤为重要了。本文将基于提供的代码片段来探讨几种不同的Java字符串处理方法,并着重分析...
在Java编程语言中,处理包含汉字的字符串时,由于汉字在不同编码格式下占用的字节数不同,按字节截取字符串会面临特殊挑战。本文将深入探讨如何正确地按字节截取带有汉字的字符串,以确保不出现半字符或者乱码的情况...
根据给定的信息,本文将详细解释如何在Java中处理中英文混合字符串的截取问题,尤其是在需要固定长度显示的情况下。 ### 一、问题背景 在实际应用开发中,经常需要处理包含中文和英文字符的字符串。例如,在一个...
javascript截取字符串(支持中英文混合) 代码如下: [removed] var sub=function(str,n){ var r=/[^\x00-\xff]/g; if(str.replace(r,”mm”).length<=n){return str;} var m=Math.floor(n/2); for(var i=m;i<str>=n...
在中文和英文混合的文本中,由于中文字符宽度通常大于英文字符宽度,若按英文字符宽度截取中文字符,或按中文字符宽度截取英文字符,很可能会导致显示效果不佳。例如,截取一个昵称时,如果使用英文的标准截取方式,...
18.如何计算中英文混合字符串的长度 19.如何判断字符串是否以指定字符串开头或结尾 20.如何判断字符是否是英文字符 21.如何检测字符串出现的次数 22.如何过滤字符串中的HTML代码 23.如何截取字符串 24.如何实现字符...
截取子串可以根据字符串的索引来进行,截取子串时如果只指定了一个索引值,则用于取得字符串中指定索引所对应的字符;如果指定两个索引值,则返回两个索引中间的字符串子串.假如有如下数据模型: Map root = new HashMap...
12. VB6.0中截取字符串:在VB6.0中,使用LEFT函数可以截取字符串,例如`LEFT("Visual Basic 6.0",6)`将返回"Visual"。 13. 软件工程管理:软件工程的理论和技术性研究不仅包括软件开发技术,还包括软件工程管理,以...