`
zhangyihui
  • 浏览: 13708 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

java解析html中的img标签,并且取得所有图片地址

    博客分类:
  • JAVA
阅读更多
	private String[] getImgs(String content) {
		String img = "";
		Pattern p_image;
		Matcher m_image;
		String str = "";
		String[] images = null;
		String regEx_img = "(<img.*src\\s*=\\s*(.*?)[^>]*?>)";
		p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
		m_image = p_image.matcher(content);
		while (m_image.find()) {
			img = m_image.group();
			Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
			while (m.find()) {
				String tempSelected = m.group(1);

				if ("".equals(str)) {
					str = tempSelected;
				} else {
					String temp = tempSelected;
					str = str + "," + temp;
				}
			}
		}
		if (!"".equals(str)) {
			images = str.split(",");
		}
		return images;
	}

 

分享到:
评论

相关推荐

    取得Img中的src的值

    通过以上分析,我们可以看到Java中如何利用正则表达式和字符串操作方法来高效地解析HTML中的图片链接。这种方法不仅适用于简单的HTML页面,也可以扩展到更复杂的场景。对于处理网络爬虫、数据抓取等任务来说非常有用...

    2021-2022计算机二级等级考试试题及答案No.16834.docx

    以下是根据给定文件中的部分内容解析出的相关知识点: 1. HTML 标签:行内元素(inline elements)指的是在HTML文档中不会单独占据一行的元素,如`&lt;em&gt;`用于强调文本,`&lt;font&gt;`(已废弃)用于设置字体,`&lt;input&gt;`...

    2021-2022计算机二级等级考试试题及答案No.19652.docx

    在给出的Python代码中,displ()和modi()函数中,img1的值不会被modi()中的赋值操作改变,因为Python的作用域规则导致img1在displ()中保持原样,所以输出结果是[12, 34, 56, 78]。 7. Word2003编辑:在Word中,水平...

    LotusDomino学习笔记.doc

    - **实现方式**: 可以通过插入图像控件或者使用`&lt;img&gt;`标签来实现。 #### 5. 链接JS文件 - **链接方法**: 在HTML文件头部使用`&lt;script&gt;`标签,设置`src`属性指向JS文件路径即可。 #### 6. 删除文档的方法 - **删除...

    Web前端教程汇总

    - **文本和图像**:学习如何使用`&lt;p&gt;`、`&lt;a&gt;`、`&lt;img&gt;`等标签来展示文本和插入图片。 - **列表与表格**:掌握无序列表`&lt;ul&gt;`、有序列表`&lt;ol&gt;`及表格`&lt;table&gt;`的创建方式。 - **链接与框架**:学会使用`&lt;a&gt;`标签创建...

Global site tag (gtag.js) - Google Analytics