论坛首页 Java企业应用论坛

用JAVA判断一个URL是否有效

浏览 14683 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2011-06-17   最后修改:2011-06-20

 最近因项目需求,需要针对一些URL地址进行检测是否可用,使用java.net 下的类来实现,主要用到了 URL和HttpURLConnection 二个类 ,URL 是统一资源标识符的引用,一个URL实例代表着一个url的引用,开始使用了URL中的的openStream()方法,这样使用倒是可以,但是速度慢,代码如下:

try {
     url = new URL("http://127.0.0.1/sj/user/getUser");
     in = url.openStream();
} catch (Exception e1) {
     System.out.println("连接打不开!");
     url = null;
}
 

 

下面判断url是不是null就可以了,速度慢

最后使用了HttpURLConnection 中的 getResponseCode();方法,HttpURLConnection : 通常一个HttpURLConnection 的实例可以生成一个请求,它有个方法 getResponseCode();可以得到请求的响应状态,该方法返回一个 int 分别是 200 and 404 如无法从响应中识别任何代码则返回 -1,代码如下:

 

 

/**
	  * 功能:检测当前URL是否可连接或是否有效,
	  * 描述:最多连接网络 3 次, 如果 3 次都不成功,视为该地址不可用
	  * @param  urlStr 指定URL网络地址
	  * @return URL
	  */
	 public synchronized String isConnect(String urlStr) {
		 int counts = 0;
		 retu = "";
		 if (urlStr == null || urlStr.length() <= 0) {                       
			 return null;                 
		 }
		 while (counts < StaticConstant.REQUEST_COUNT) {
			 long start = 0;
			 try {
				 url = new URL(urlStr);
				 start = System.currentTimeMillis();
				 con = (HttpURLConnection) url.openConnection();
				 state = con.getResponseCode();
				 log.info("请求断开的URL一次需要:"+(System.currentTimeMillis()-start)+"毫秒");
				 if (state == 200) {
					 retu = "ok";
					 log.info(urlStr+"--可用");
				 }
				 break;
			 }catch (Exception ex) {
				 counts++; 
				 log.info("请求断开的URL一次需要:"+(System.currentTimeMillis()-start)+"毫秒");
				 log.info("连接第 "+counts+" 次,"+urlStr+"--不可用");
				 continue;
			 }
		 }
		 return retu;
	 }
 

 

   发表时间:2011-06-18  
不错 以前只是注意到了url的格式问题,对于是否可用没有考虑,这个确实不错,谢谢分享思路
0 请登录后投票
   发表时间:2011-06-20  
我考虑的问题是,如何分辨 找不到页面 和 跳转两种情况,是不是有的网站会在页面不存在的时候自动跳转到特定的 找不到页面,这个可用还是不可用?另外在访问页面需要检查权限的情况下,自动跳转到登陆页面是认定为可用还是不可用,又何以判断这个页面是不是存在
可用和不可用在项目中怎么界定
0 请登录后投票
   发表时间:2011-06-20  
Dominic_jin 写道
我考虑的问题是,如何分辨 找不到页面 和 跳转两种情况,是不是有的网站会在页面不存在的时候自动跳转到特定的 找不到页面,这个可用还是不可用?另外在访问页面需要检查权限的情况下,自动跳转到登陆页面是认定为可用还是不可用,又何以判断这个页面是不是存在
可用和不可用在项目中怎么界定


这个好判断,找不到页面是404的response code。
跳转的话有2中情况,一种是根据协议跳转就是302,303的code,另外一种是js的redirect。不管是哪种,只要不是404就接下来可以继续根据状态吗或者response 的content的特征来判断。解决了你的问题了吧
0 请登录后投票
   发表时间:2011-06-20   最后修改:2011-06-20
Dominic_jin 写道
我考虑的问题是,如何分辨 找不到页面 和 跳转两种情况,是不是有的网站会在页面不存在的时候自动跳转到特定的 找不到页面,这个可用还是不可用?另外在访问页面需要检查权限的情况下,自动跳转到登陆页面是认定为可用还是不可用,又何以判断这个页面是不是存在
可用和不可用在项目中怎么界定

0 请登录后投票
   发表时间:2011-06-20   最后修改:2011-06-20
代码是不是有点问题
}catch (Exception ex) {
     counts++; 
     System.out.println("URL不可用,连接第 "+counts+" 次");
     urlStr = null;
     continue;
    }

如果第一次就出错了.那么走到catch中.你把urlStr置为空.那么后面的4次连接有何意义?其实你只连接了一次.
ps:你要检查链接是否可用.为何不直接返回state 而返回Url
0 请登录后投票
   发表时间:2011-06-21  
只支持http协议吗?ftp呢?
0 请登录后投票
   发表时间:2011-06-21  
楼主还没有考虑到使用代理否的问题,得加上代理的判断
0 请登录后投票
   发表时间:2012-06-04  
我怎么判断JS的跳转乃?????????????求教
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics