=======================
©Copyright 蕃薯耀 2021-01-22
http://fanshuyao.iteye.com/
import java.util.LinkedHashMap; import java.util.Map; import java.util.Set; import org.apache.commons.lang.StringUtils; import org.apache.log4j.Logger; public class UrlUtils { private static Logger log = Logger.getLogger(UrlUtils.class); public static final String QUESTION_MARK = "?"; public static final String AND_MARK = "&"; public static final String EQUAL_MARK = "="; /** * 获取链接的参数 * @param url 链接 * @return */ public static LinkedHashMap<String, String> getParamsMap(String url){ log.info("url=" + url); if(StringUtils.isBlank(url)){ return null; } url = url.trim(); int length = url.length(); int index = url.indexOf(QUESTION_MARK); if(index > -1){//url说明有问号 if((length - 1) == index){//url最后一个符号为?,如:http://wwww.baidu.com? return null; }else{ //情况为:http://wwww.baidu.com?aa=11或http://wwww.baidu.com?aa=或http://wwww.baidu.com?aa String baseUrl = url.substring(0, index); String paramsString = url.substring(index + 1); log.info("baseUrl=" + baseUrl); log.info("paramsString=" + paramsString); if(!StringUtils.isBlank(paramsString)){ LinkedHashMap<String, String> paramsMap = new LinkedHashMap<String, String>(); String[] params = paramsString.split(AND_MARK); for (String param : params) { if(!StringUtils.isBlank(param)){ String[] oneParam = param.split(EQUAL_MARK); String paramName = oneParam[0]; if(!StringUtils.isBlank(paramName)){ if(oneParam.length > 1){ paramsMap.put(paramName.trim(), oneParam[1]);//键可以去空格,值不能去空格 }else{ paramsMap.put(paramName.trim(), ""); } } } } return paramsMap; } } } return null; } /** * 向url链接追加参数(会覆盖已经有的参数) * @param url 链接地址 * @param params LinkedHashMap<String, String> 参数 * @param isOverride 是否覆盖参数,true表示将新参数覆盖链接原参数,false不覆盖 * @return */ public static String addParams(String url, LinkedHashMap<String, String> params, boolean isOverride){ if(StringUtils.isBlank(url)){ return ""; }else if(params == null || params.size() < 1){ return url.trim(); }else{ url = url.trim(); int index = url.indexOf(QUESTION_MARK); String baseUrl = ""; if(index > -1){ baseUrl = url.substring(0, index); }else{ baseUrl = url; } LinkedHashMap<String, String> paramsMapInUrl = getParamsMap(url); if(paramsMapInUrl == null){ paramsMapInUrl = new LinkedHashMap<String, String>(); } if(!isOverride){ //移除Url链接已经存在的参数 LinkedHashMap<String, String> newParams = new LinkedHashMap<String, String>(params.size()); for (Map.Entry<String, String> entry : params.entrySet()) { if(!StringUtils.isBlank(entry.getKey())){ newParams.put(entry.getKey().trim(), entry.getValue()); } } for (Map.Entry<String, String> entry : newParams.entrySet()) { for (Map.Entry<String, String> urlEntry : paramsMapInUrl.entrySet()) { if(!StringUtils.isBlank(entry.getKey())){ if(entry.getKey().trim().equals(urlEntry.getKey())){ params.remove(entry.getKey().trim()); } } } } } for (Map.Entry<String, String> entry : params.entrySet()) { paramsMapInUrl.put(entry.getKey().trim(), entry.getValue()); } //重新拼接链接 if(paramsMapInUrl != null && paramsMapInUrl.size() > 0){ StringBuffer paramBuffer = new StringBuffer(baseUrl); paramBuffer.append(QUESTION_MARK); Set<String> set = paramsMapInUrl.keySet(); for (String paramName : set) { paramBuffer.append(paramName).append(EQUAL_MARK) .append(paramsMapInUrl.get(paramName) == null ? "" : paramsMapInUrl.get(paramName)) .append(AND_MARK); } paramBuffer.deleteCharAt(paramBuffer.length() - 1); return paramBuffer.toString(); } return baseUrl; } } /** * 向url链接追加参数(单个) (会覆盖已经有的参数) * @param url 链接地址 * @param name String 参数名 * @param value String 参数值 * @param isOverride 是否覆盖参数,true表示将新参数覆盖链接原参数,false不覆盖 * @return */ public static String addParam(String url, String name, String value, boolean isOverride){ if(StringUtils.isBlank(url)){ return ""; }else if(StringUtils.isBlank(name)){ return url.trim(); }else{ LinkedHashMap<String, String> params = new LinkedHashMap<String, String>(); params.put(name.trim(), value); return addParams(url, params, isOverride); } } /** * 向url链接追加参数(单个) (会覆盖已经有的参数) * @param url 链接地址 * @param name String 参数名 * @param value String 参数值 * @return */ public static String addParam(String url, String name, String value){ return addParam(url, name, value, true); } /** * 向url链接追加参数(单个) (不会覆盖已经有的参数) * @param url 链接地址 * @param name String 参数名 * @param value String 参数值 * @return */ public static String addParamNotExist(String url, String name, String value){ return addParam(url, name, value, false); } /** * 向url链接追加参数(会覆盖已经有的参数) * @param url 链接地址 * @param params LinkedHashMap<String, String> 参数 * @return */ public static String addParams(String url, LinkedHashMap<String, String> params){ return addParams(url, params, true); } /** * 向url链接追加参数(不会覆盖已经有的参数) * @param url 链接地址 * @param params LinkedHashMap<String, String> 参数 * @return */ public static String addParamsNotExist(String url, LinkedHashMap<String, String> params){ return addParams(url, params, false); } /** * 移除url链接的多个参数 * @param url String 链接地址 * @param paramNames String... 参数 * @return */ public static String removeParams(String url, String... paramNames){ if(StringUtils.isBlank(url)){ return ""; }else if(paramNames == null || paramNames.length < 1){ return url.trim(); }else{ url = url.trim(); int length = url.length(); int index = url.indexOf(QUESTION_MARK); if(index > -1){//url有问号 if((length - 1) == index){//url最后一个符号为?,如:http://wwww.baidu.com? return url; }else{ LinkedHashMap<String, String> paramsMap = getParamsMap(url); //删除参数 if(paramsMap != null && paramsMap.size() > 0){ for (String paramName : paramNames) { if(!StringUtils.isBlank(paramName)){ paramsMap.remove(paramName.trim()); } } } String baseUrl = url.substring(0, index); //重新拼接链接 if(paramsMap != null && paramsMap.size() > 0){ StringBuffer paramBuffer = new StringBuffer(baseUrl); paramBuffer.append(QUESTION_MARK); Set<String> set = paramsMap.keySet(); for (String paramName : set) { paramBuffer.append(paramName).append(EQUAL_MARK).append(paramsMap.get(paramName)).append(AND_MARK); } paramBuffer.deleteCharAt(paramBuffer.length() - 1); return paramBuffer.toString(); } return baseUrl; } } return url; } } public static void main(String[] args) { /* String a = "http://wwww.baidu.com"; String b = "http://wwww.baidu.com?"; String c = "http://wwww.baidu.com?aa=11"; String d = "http://wwww.baidu.com?aa"; String e = "http://wwww.baidu.com?aa=11&bb=222&cc=33"; String f = "http://wwww.baidu.com?aa=11&bb=222&cc=33&dd="; String g = "http://wwww.baidu.com?aa=111&bb=222&cc=33&dd"; */ /* List<String> params = new ArrayList<String>(); params.add("aa"); System.out.println("d="+removeParams(d, params)); params.add("bb"); System.out.println("e="+removeParams(e, params)); params.add("cc"); System.out.println("f="+removeParams(f, params)); params.add("dd"); System.out.println("g="+removeParams(g, params)); */ /* System.out.println("g="+removeParams(g, "cc","aa","dd")); System.out.println("g2="+removeParams(g, "cc","aa","dd")); System.out.println("d="+removeParams(d, "cc")); System.out.println("d2="+removeParams(d, "aa")); System.out.println("a="+removeParams(a, "aa")); System.out.println("b="+removeParams(b, "aa")); */ /* System.out.println("a==="+addParam(a, "p", "cc")); System.out.println("b==="+addParam(b, "p", "cc")); System.out.println("c==="+addParam(c, "p", "cc")); System.out.println("d==="+addParam(d, "p", "cc")); */ /* System.out.println("g1==="+addParam(g, "bb", "000")); System.out.println("g2==="+addParamNotExist(g, "bb", "000")); */ /* LinkedHashMap<String, String> paramsMap = new LinkedHashMap<String, String>(); paramsMap.put("jj", "j13"); paramsMap.put("kkk", "k1243"); paramsMap.put("mm", ""); paramsMap.put("nn", null); paramsMap.put("bb", "new"); //System.out.println("a==="+addParams(a, paramsMap)); //System.out.println("b==="+addParams(b, paramsMap)); //System.out.println("c==="+addParams(c, paramsMap)); //System.out.println("d==="+addParams(d, paramsMap)); System.out.println("f1==="+addParams(f, paramsMap)); System.out.println("f2==="+addParamsNotExist(f, paramsMap)); */ //System.out.println("g2="+getParamsMap(g)); } }
=======================
©Copyright 蕃薯耀 2021-01-22
http://fanshuyao.iteye.com/
相关推荐
Apache 官方 URLEncodedUtils.java 工具类,可以用来获取Url中的字段value值
20. **URL处理工具类**:如UrlUtils,对URL进行解析、构建、编码等操作,处理网络链接问题。 21. **编码转换工具类**:如CharsetUtils,处理字符集的转换,确保在不同系统间数据的一致性。 22. **对象判断工具类**...
13. **URL处理工具类**:`UrlUtils`可以帮助处理URL,包括构建、解析和修改URL,如`buildUrl()`用于创建URL,`getQueryParams()`能提取URL中的查询参数。 14. **对象拷贝工具类**:如`BeanUtils`,提供了对象属性的...
在Java开发过程中,工具类(Utility Class)是程序员经常使用的代码模块,它们提供了一系列静态方法,用于执行特定的辅助任务,提升代码复用性。"开发常用工具类"这个主题涵盖了各种不同领域的实用功能,例如字符串...
Java作为一门广泛应用的编程语言,提供了多种库来处理这项工作,其中之一就是jSoup。本篇将详细介绍jSoup库在...结合`UrlUtils.java`这样的辅助工具类,可以构建高效稳定的网页爬虫系统,进行定制化的数据采集任务。
`UrlUtils.java`可能是自定义的工具类,它封装了处理URL和发起HTTP请求的方法。在源码中,这个类可能包含了创建URL对象、设置请求头、写入文件数据到请求体以及执行请求等功能。 - **创建URL对象**:使用`java...
库中还有对URL的处理,如URLUtils类,可以解析和构建URL,方便进行网络资源的访问。 6. **多线程和异步处理**: 在处理网络连接时,多线程和异步操作是常见的需求。在源码中,你可以学习到如何在Java中实现这些...