Java实现从html中提取css -

allenson933

浏览: 24419 次
性别:
来自: 厦门

最近访客更多访客>>

cz3565123

花落惊飞羽

lys819537936

zx1994

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Java实现从html中提取css

博客分类：

java html css

项目中需要实现一个功能，即将html中标签的style属性值，提取出单独的css文件。

目前已有相关的网站实现： extractcss.com

虽然开源，但是它是通过js实现，而且用到了jquery。

本文将讨论如何在java中实现类似的功能，由于项目的需要，所以只实现一部分功能（class选择器）。

该功能用到了Java中拥有类似于JQuery选择器功能的html解析工具Jsoup： http://jsoup.org/

实现的方法如下：

/**
	 * 从html中获取出css文本
	 * 参考extractCss网站
	 * 借助于Js
	 * @param html    含有style格式的html文本
	 * @return        提取出的css文本
	 */
	public static String extractCss(String html){
		Set<String> allClasses = new HashSet<String>();   // 初始化参数
		StringBuffer resultCss = new StringBuffer();
		org.jsoup.nodes.Document doc = Jsoup.parse(html);       //获取html对象
		Elements classes = doc.select("*[class]");
		for(Iterator<Element> ite = classes.iterator(); ite.hasNext();){
			Element element = ite.next();
			String splits[] = element.attr("class").split(" ");
			for(int i=0; i< splits.length; i++){
				allClasses.add(splits[i]);
				if(i==splits.length-1){
					Elements children = doc.select("."+splits[i]+"> *");
					for(Iterator<Element> tor = children.iterator(); tor.hasNext();){
						Element e = tor.next();
						if(!e.hasAttr("class")){                   //如果没有定义class属性
							allClasses.add(splits[i]+" > "+e.tagName().toLowerCase());
						}
					}
				}
			}
		}
		for(String clss: allClasses){
			Elements element = doc.select("."+clss);
			if(element.hasAttr("style")){
				resultCss.append("."+clss+"{"+element.attr("style")+"}");
			}
		}
		return resultCss.toString();
	}

分享到：

将博客搬至CSDN | 微软笔试 2012-04-07

2014-03-02 20:54
浏览 8273
评论(1)
分类:Web前端
查看更多

1 楼 353390229 2017-04-07

两个步骤轻松提取部分网页里的部分界面css样式，简单易用，精练且准确。

打开工具 http://collect1.longsunhd.com/getcss/

第一步输入要提取内容和样式的网页地址。

第二步在获取得的源代码框内选中要提取的部分html源代码。

结果框内出现自动提取的简化样式（css）及html代码

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Java实现从html中提取css

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Java实现从html中提取css

评论

发表评论

相关推荐

最近访客更多访客>>