import java.util.ArrayList; import java.util.List; import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.filters.NodeClassFilter; import org.htmlparser.nodes.TagNode; import org.htmlparser.tags.ImageTag; import org.htmlparser.util.NodeList; import org.htmlparser.util.ParserException; public class ParserUtil { /** * 根据标签名称 和属性值 获取 * @param <T> * @param html * @param tagType * @param attributeName * @param attributeValue * @return */ public static <T extends TagNode> List<T> parsTags(String html, final Class<T> tagType, final String attributeName, final String attributeValue) { try { Parser parser = new Parser(); parser.setInputHTML(html); NodeList tagList =parser.parse( new NodeFilter(){ @Override public boolean accept(Node node) { if(node.getClass()== tagType){ T tn = (T)node; if(attributeName == null){ return true; } String attrValue = tn.getAttribute(attributeName); if(null != attrValue && attrValue.equals(attributeValue)){ return true; } } return false; } } ); List<T> tags= new ArrayList<T>(); for(int i=0; i< tagList.size(); i++){ T t = (T)tagList.elementAt(i); tags.add(t); } return tags; } catch (ParserException e) { e.printStackTrace(); } return null; } public static <T extends TagNode> List<T> parsTags(String html, final Class<T> tagType) { return parsTags(html,tagType,null ,null); } /** * 获取单个唯一标签 * @param <T> * @param html * @param tagType * @param attributeName * @param attributeValue * @return */ public static <T extends TagNode> T parsTag(String html, final Class<T> tagType, final String attributeName, final String attributeValue) { List<T> tags = parsTags(html,tagType, attributeName, attributeValue); if(tags != null && tags.size()>0){ return tags.get(0); } return null; } public void getimg(String html){ try { Parser parser = new Parser(); parser.setInputHTML(html); NodeList imageTags = parser.parse(new NodeClassFilter(ImageTag.class)); for(int i=0; 1<imageTags.size(); i++){ ImageTag it = (ImageTag) imageTags.elementAt(i); String imageUrl = it.getImageURL(); System.out.print(imageUrl); } } catch (ParserException e) { e.printStackTrace(); } } }
相关推荐
一款基于机器学习的Web日志统计分析与异常检测命令行工具_hy4
基于RBAC权限控制的资产管理系统_hy5
318 Series Hardened Access Points 370 Series Outdoor Access Points 310 Series Campus Access Points IAP-315 IAP-314
最强PMP备考计划、知识整理、试题,并以本系统来展示_hy5
【官方】计算机职业英语一级考试样卷.pdf 【官方】全国机等级考试二级笔试样卷:存取(Access)数据库程序设计.pdf 【官方】全国计算机等级考试二级笔试样卷:C++语言程序设计.pdf 【官方】全国计算机等级考试二级笔试样卷:C语言程序设计.pdf 【官方】全国机等级考试二级笔试样卷:德尔菲(Delphi)语言程序设计.pdf 【官方】全国机等级考试二级笔试样卷:Java语言程序设计.pdf 【官方】全国机等级考试二级笔试样卷:视觉基础语言程序设计.pdf 【官方】全国机等级考试二级笔试样卷:视讯FoxPro数据库程序设计.pdf 【官方】全国计算机等级考试三级笔试样卷:PC技术,pdf 【官方】全国计算机等级考试三级笔试样卷:网络技术.pdf 【官方】全国计算机等级考试三级笔试样卷:信息管理技术,pdf 【官方】全国计算机等级考试四级笔试样卷:软件测试工程师.pdf 【官方】全国计算机等级考试四级笔试样卷:数据库工程师,pdf 【官方】全国计算机等级考试四级笔试样卷:数据库技术,pdf 【官方】全国计算机等级考试四级笔试样卷:网络工程师.pdf
SpringBoot网上商城#java#毕业设计#网上商城#springboot#课程设计#编程#thymeleaf_hy4
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
360 Series Outdoor Access Points 303 Series Campus Access Points 303H Series Hospitality Access Points 300 Series Campus Access Points
肽质量指纹图谱提取区域检测系统源码分享[一条龙教学YOLOV8标注好的数据集一键训练_70+全套改进创新点发刊_Web前端展示]
分布式事务实战_hy4
python网络爬虫按月爬cctv新闻30分的视频_hy4
【golang】企业微信群机器人接口Golang封装
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。
mumu-activemq是一个对老牌mq消息中间件的学习和测试项目,本人通过这个项目来熟悉activemq的消息发送流_hy4
【Python+HTML】基于flask的rbac学生权限管理系统,redis存储session_pgj
一步一步学springboot2:微服务项目实战(第二版)_hy5
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。
新建 DOC 文档.doc
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。