`
andrew.yulong
  • 浏览: 171605 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

正则只替换URL字符串里面的汉字部分(转载CSDN)

    博客分类:
  • java
阅读更多

URL为 http://192.168.1.1:8080/resources/电话.xls
如果使用 URLEncoder.encode 将会把冒号等一块给替换了
http%3A%2F%2F192.168.1.1%3A8080%2Fresources%2F%E7%94%B5%E8%AF%9D.xls

这并不是我们需要的,我们只希望替换编码里面中文的部分,这里给出了解决方法,很简单

package log;

import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 正则替换字符串里面的汉字部分。
 * 
 * @author 赵学庆 www.java2000.net
 */
public class URLEncoderHZ {
  public static void main(String[] args) throws Exception {
    String str = "http://192.168.1.1:8080/resources/电话.xls";
    System.out.println(encode(str, "UTF-8"));
  }

  private static String zhPattern = "[\u4e00-\u9fa5]+";

  /**
   * 替换字符串卷
   * 
   * @param str 被替换的字符串
   * @param charset 字符集
   * @return 替换好的
   * @throws UnsupportedEncodingException 不支持的字符集
   */
  public static String encode(String str, String charset) throws UnsupportedEncodingException {
    Pattern p = Pattern.compile(zhPattern);
    Matcher m = p.matcher(str);
    StringBuffer b = new StringBuffer();
    while (m.find()) {
      m.appendReplacement(b, URLEncoder.encode(m.group(0), charset));
    }
    m.appendTail(b);
    return b.toString();
  }
}

 

分享到:
评论

相关推荐

    验证数字的正则表达式集

    正则表达式是一种强大的文本处理工具,用于匹配、查找、替换和验证字符串模式。在IT领域,尤其是在前端开发、后端验证以及数据处理中,正则表达式是必不可少的技能之一。以下是一些针对数字验证的常用正则表达式及其...

    JAVA正则表达式语法大全

    正则表达式是一种用于匹配字符串中字符组合的强大工具,在编程中广泛应用于文本搜索、替换等操作。Java中的正则表达式支持标准的正则表达式语法,并通过`java.util.regex`包提供了一系列类来实现正则表达式的功能。 ...

    urlchange_visualbasic_

    例如,`Replace()`函数用于替换字符串中的特定子串,`Mid()`和`Left()`函数用于提取字符串的一部分,而`Chr()`和`Asc()`函数则用于字符和ASCII值之间的转换。 对于迅雷、快车、旋风等下载地址的转换,关键在于识别...

    PHP正则表达式

    它能够帮助开发者进行文本搜索、替换以及验证等操作,极大地提高了处理字符串数据的效率。 #### 1. 数字相关的正则表达式 - **"^\\d+$"**:该表达式用于匹配任何由一个或多个数字组成的字符串。 - **"^[0-9]*[1-9]...

    一些常用的正则表达式

    通过定义一种由字符和特殊符号组成的语言,正则表达式能够帮助开发者匹配、查找、替换等操作复杂的字符串模式。 ### 常用正则表达式实例 #### 验证汉字 - **表达式**:`[\u4e00-\u9fa5]` - **说明**:这个表达式...

    正则表达式

    正则表达式是一种强大的文本处理工具,在JavaScript等编程语言中被广泛用于字符串搜索和替换等操作。对于网页表单验证来说,正则表达式能够帮助开发者高效地检查用户输入是否符合预期格式,比如电子邮件地址、电话...

    PilotEdit_Lite8.5.0

    例如,你可以快速查找并替换所有符合特定模式的字符串,大大减少了手动操作的时间。 除了以上功能,PilotEdit还支持文件目录比较,帮助用户识别不同版本之间的差异,这对于协同开发和版本控制非常有帮助。同时,它...

    freemarker总结

    其它的运行符可以作用于数字和日期,但不能作用于字符串,大部分的时候,使用gt等字母运算符代替>会有更好的效果,因为 FreeMarker会把>解释成FTL标签的结束字符,当然,也可以使用括号来避免这种情况,如:(x>y)> ...

    js使用小技巧

    让英文字符串超出表格宽度自动换行 word-wrap: break-word; word-break: break-all; 透明背景 <IFRAME src="1.htm" width=300 height=180 allowtransparency></iframe> 获得style内容 obj.style.cssText ...

Global site tag (gtag.js) - Google Analytics