0 0

java 判断一段html代码有没有外链接,除了flash的地址30

请教一下,用xheditor编辑器,用户编辑后,编辑器将html代码传到后台action的一个string里,string中不能有外链接,除了flash地址和公司服务器的链接。
2014年12月27日 01:02

2个答案 按时间排序 按投票排序

0 0

楼主可以通过正则表达式来匹配,但是这样效率很低。我建议楼组使用Jsoup这样的工具包来实现,和js那样很想,可以通过查询表达式获取到所有的标签和属性,效率也非常高。

2015年7月12日 22:38
0 0



import java.io.BufferedReader;
import java.io.FileReader;
import java.io.BufferedWriter;
import java.io.FileWriter;


import java.util.regex.Pattern;
import java.util.regex.Matcher;

/**
 * @author Royh.L
 * @date   2014.12.30
**/
public class URLTest {


	public static void main(String[] args) throws Exception {
		//FileInputStream html = new FileInputStream("html.txt");

		BufferedReader html = new BufferedReader(new FileReader("html.txt"));
		BufferedWriter localTxt = new BufferedWriter(new FileWriter("local.txt"));
		BufferedWriter outTxt = new BufferedWriter(new FileWriter("out.txt"));

		String locals[] = {"iteye.com"};
		
		// src="http://x.y.c/m?n=t"
		Pattern p = Pattern.compile("(?:(?:href)|(?:src))=\"(?:http://)?(([?=a-zA-Z0-9/._-]+))\"", Pattern.CASE_INSENSITIVE);

		//Matcher m = p.matcher("script><link href=\"http://www.iteye.com/stylesheets/ask.css?1418977807\"");

		// 这里的html.txt是压缩的,这里只有一行。
		// 如果没有压缩,则循环html.readLine()判断。
		Matcher m = p.matcher(html.readLine());

		String url = "";
		while(m.find()) {
			// get url.
			url = m.group(1);  
			System.out.println(url);
			//if(url != null) 
			for(String local : locals) {
				// local 
				// 绝对路径 iteye.com    eg: src="http://xxx.iteye.com/yyy?ddd"
				// 相对路径 no iteye.com eg: src="/images/x.y"
				if(url.indexOf(local) != -1 || url.split("/")[0].indexOf(".") == -1) { 
					localTxt.write(m.group(0) + "\r\n");
				} else { // out
					outTxt.write(m.group(0) + "\r\n");
				}
			}
		}

		localTxt.close();
		outTxt.close();
		html.close();
		//System.out.println(html);
	}

}

2014年12月30日 12:53

相关推荐

    使用java快速判断网页链接是否有效

    本文将详细介绍如何使用Java语言来实现一个简单的工具方法,用于快速判断一个网页链接是否有效。 #### 一、方法原理 本方法通过`java.net.URL`类创建一个URL对象,并使用`java.net.HttpURLConnection`类打开与该...

    Java2Pas Java代码转pas代码

    Java2Pas是一个实用工具,主要用于将Java编程语言编写的源代码转换为Pascal语言的等效代码。这个工具对于那些需要在两种语言之间迁移代码或者理解不同编程语言语法的开发者来说非常有价值。Java和Pascal虽然都是面向...

    java源码包---java 源码 大量 实例

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    7个Java小游戏源代码

    7个Java小游戏源代码 解压密码是:yykings

    java判断百度地图的点是否在多边形区域内

    在Java编程中,判断一个点是否位于多边形区域内是一个常见的地理空间运算问题。这个问题在地图应用、GIS(地理信息系统)以及游戏开发等领域有广泛的应用。以下是对这个知识点的详细阐述: 1. **坐标系统与投影**:...

    很强大的java代码混淆工具 Jocky

    Jockey跟其他混淆工具不同的是:它是直接对编译过程做文章,也就是在把java文件编译为class文件的过程中对代码进行混淆,混淆后的代码中包含很多JVM 指令,大家知道JVM指令是面向机器的,人类一般很难看懂!...

    java根据ip获取国家、地区名称,附带ip地址库

    在Java编程中,根据IP地址获取国家和地区名称是一项常见的需求,尤其在数据分析、网络监控或者用户定位等场景中。这个话题涉及到的主要知识点包括IP地址处理、数据库查询以及使用第三方库。 首先,IP地址是一个32位...

    Java开发技术大全(500个源代码).

    代码范例列表 第1章 示例描述:本章演示如何开始使用JDK进行程序的开发。 HelloWorldApp.java 第一个用Java开发的应用程序。 firstApplet.java 第一个用Java开发的Applet小程序。 firstApplet.htm 用来装载...

    java程序表白代码

    "Java程序表白代码"就是这样一个实例,它巧妙地利用编程语言来创造出浪漫的表达方式,为恋人间的互动添加科技的温度。Java,作为一种广泛使用的面向对象的编程语言,以其严谨性、跨平台性和丰富的库资源而闻名,但在...

    大鱼吃小鱼JAVA版本源代码

    "大鱼吃小鱼"是一款经典的休闲游戏,其JAVA版本的源代码为我们提供了一个学习和研究JAVA编程在游戏开发中的应用的机会。以下是对这个项目的一些关键知识点的详细解析: 1. **JAVA编程语言**:本项目是用JAVA语言...

    java转js工具

    Java到JavaScript转换工具有助于开发者将已有的Java代码库移植到JavaScript环境中,这在Web开发中尤其有用,因为JavaScript是浏览器端的主要脚本语言。这样的工具能够帮助开发者利用Java的强大功能来构建前端应用,...

    java人脸识别源代码

    使用JNI时,需要编写本地方法声明,创建头文件,编写C/C++代码实现这些方法,并通过javah工具生成对应的C/C++头文件,最后编译生成动态链接库供Java调用。 在"人脸识别_java"这个压缩包中,可能包含了以下文件结构...

    JAVA加密 保护源代码 防止反编译的工具

    Java有了它方便的一个方面,但是他同时也带给了开发者一个烦恼,这就是保护的办法不多,而且大多数不是很好用,这样自己辛苦开发出来的程序很容易被人反编译过来而据为己有,一般情况下,大多数的人都是用混编器...

    公司网站源代码-java

    这是一个基于Java的公司宣传网站的源代码,它提供了多种功能,包括用户交互的前台展示以及后台管理。下面将详细阐述相关的核心知识点。 1. **Servlet**:Servlet是Java编程语言中用来扩展服务器功能的接口,它能够...

    java新浪微博(含源代码)

    通过阅读和学习这些源代码,可以深入理解如何在Java中实现一个完整的微博客户端应用。这不仅涉及到网络编程和API交互,还涵盖了用户界面设计、数据持久化、异常处理等多个方面的知识。 总结来说,"java新浪微博(含...

    最新版java代码生成器基于springMvc+mysql 后台功能一键生成

    一个基于java springMvc开发的代码生成器, 1为java工程师自动编写各种复杂的增删改查功能 2我提供各种友好的service接口 3 我能提供多种http json接口 .... 这个是这个工具的使用说明地址 ...

    java编写的一个简单bbs网站完整代码

    这是一个基于Java技术构建的简易BBS(Bulletin Board System,电子公告板)网站的完整源代码。这个项目非常适合Java初学者进行学习和研究,因为它提供了一个实际应用的基础框架,可以帮助理解Web开发的基本流程。 ...

    java代码编写规范

    Java程序员编写代码时应当遵循的一些基本规范

    java实现聊天室功能(全部代码,有界面)

    title: Java 实现聊天室功能(全部代码,有界面) description: 该项目是一个 Java 实现的聊天室系统,支持群聊、公聊、私聊等功能,並支持刷新好友列表。使用 Swing 库来创建简单的界面,可以多人登录。 标签: ...

    JAVA爬虫项目源代码

    【JAVA爬虫项目源代码】是一个使用JAVA编程语言编写的爬虫项目,它结合了多线程编程和队列管理技术来提升数据抓取的效率和并发性。在这个项目中,开发者利用了以下核心技术: 1. **HttpClinet**:HttpClinet是Java...

Global site tag (gtag.js) - Google Analytics