`
zhangyihui
  • 浏览: 13494 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

java解析html中的img标签,并且取得所有图片地址

    博客分类:
  • JAVA
阅读更多
	private String[] getImgs(String content) {
		String img = "";
		Pattern p_image;
		Matcher m_image;
		String str = "";
		String[] images = null;
		String regEx_img = "(<img.*src\\s*=\\s*(.*?)[^>]*?>)";
		p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
		m_image = p_image.matcher(content);
		while (m_image.find()) {
			img = m_image.group();
			Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
			while (m.find()) {
				String tempSelected = m.group(1);

				if ("".equals(str)) {
					str = tempSelected;
				} else {
					String temp = tempSelected;
					str = str + "," + temp;
				}
			}
		}
		if (!"".equals(str)) {
			images = str.split(",");
		}
		return images;
	}

 

分享到:
评论

相关推荐

    Java正则表达式去除img标签的src内容

    java代码,从image标签中正则匹配取出src标签的内容,java代码,从image标签中正则匹配取出src标签的内容

    正则获取html中的 <img src = 图片地址

    &lt;img src="图片地址" alt="图片描述" /&gt; ``` 其中,`src`属性指定图片的URL,`alt`属性提供图片的替代文本。 正则表达式是一种模式匹配的语言,可以用来搜索、替换或者分割字符串。要提取`&lt;img&gt;`标签的`src`属性,...

    java实现HTML解析图片批量下载

    在"java实现HTML解析图片批量下载"这个项目中,我们将主要关注两个核心部分:HTML解析和图片下载。 首先,我们需要引入Jsoup库。在你的`pom.xml`文件(如果你使用的是Maven)中添加以下依赖: ```xml &lt;groupId&gt;...

    Java 获取Html文本中的img标签下src中的内容方法

    Java 获取Html文本中的img标签下src中的内容方法 ...Java 获取Html文本中的img标签下src中的内容方法是一种实用的方法,能够帮助开发者快速地提取网页中的图片地址,并提高开发效率和数据分析能力。

    java代码-正则去除HTML代码中的IMG标签

    在Java编程中,处理HTML内容时,我们可能会遇到需要移除特定标签,比如IMG标签的情况。这通常是出于数据清理、文本分析或者某些特定需求。在这个案例中,我们要使用正则表达式来实现这个功能。正则表达式是匹配和...

    Java抓取网页图片链接地址

    抓取网页图片链接的基本思路是通过解析HTML文档来识别`&lt;img&gt;`标签中的`src`属性值,即图片的实际URL。本示例代码利用了Java正则表达式与`java.util.regex`包中的`Pattern`和`Matcher`类来完成这一任务。 #### 示例...

    剔除内容中img标签

    剔除内容中的标签 如:img、p、input、span、div等等

    java正则表达式过滤html标签

    HtmlRegexpUtil这个工具类提供了多种过滤html标签的方法,包括过滤所有以"开头以"&gt;"结尾的标签、找出IMG标签、找出IMG标签的SRC属性等。 HtmlRegexpUtil类中的filterHtml方法使用正则表达式来过滤所有以"开头以"&gt;...

    java实现本地读取图片存储到数据库中并在html网页显示

    前端接收到图片的二进制数据后,可以通过`Blob`和`URL.createObjectURL()`将数据转化为URL,然后在HTML中设置`&lt;img&gt;`标签的`src`属性。例如: ```javascript let imgBlob = new Blob([response.data], {type: '...

    匹配img标签_匹配src中的值

    要从HTML文本中提取所有`&lt;img&gt;`标签的`src`属性值,我们可以利用正则表达式(Regular Expression)这一强大的文本处理工具。正则表达式是一种模式匹配语言,可以用来在字符串中查找、替换或者捕获特定模式。 首先,...

    Java读取word文档内容并输出成网页(含图片,公式)

    7. **构建HTML**:将所有这些内容组合成一个HTML字符串,包括适当的标签(如`&lt;p&gt;`、`&lt;h1&gt;`、`&lt;table&gt;`、`&lt;img&gt;`等),并确保图片和公式链接指向正确的位置。 8. **输出到网页**:最后,将生成的HTML字符串写入到...

    Java正则表达式过滤html标签1[参考].pdf

    本文将介绍如何使用Java正则表达式来过滤HTML标签,包括过滤所有以“&lt;”开头以“&gt;”结尾的标签、提取IMG标签的SRC属性等。 过滤所有以“&lt;”开头以“&gt;”结尾的标签 在HtmlRegexpUtil类中,我们定义了一个静态变量...

    用正则表达式替换图片地址img标签

    例如,假设我们要将所有图片地址替换为一个新的URL: ```javascript let newSrc = 'https://example.com/new-image.png'; content.replace(/&lt;img [^&gt;]*src=['"]([^'"]+)[^&gt;]*&gt;/gi, function (match, capture) { ...

    如何解决java html转pdf图片不显示问题的源码范例(由浅入深代码范例和详细说明).docx

    接着,我们设置了 PdfWriter 的 strictImageSequence 属性为 true,这有助于确保图片按照正确的顺序出现在 PDF 中。之后,我们打开文档并创建了一个 ITextRenderer 对象,这个对象负责将 HTML 解析为 PDF。 ...

    java web开发中所有用到的html和http解析

    属性如`src`用于指定图片或音频资源的URL,`href`用于链接地址。 3. **表格和表单**:`&lt;table&gt;`元素用于创建表格,`&lt;tr&gt;`定义行,`&lt;td&gt;`和`&lt;th&gt;`定义单元格。`&lt;form&gt;`用于创建表单,`&lt;input&gt;`、`&lt;select&gt;`、`...

    如何解决java html转pdf图片不显示问题的源码范例合集new(由浅入深代码范例和详细说明).docx

    在 Java 开发中,经常需要将 HTML 转换为 PDF,并希望在生成的 PDF 中正确显示 HTML 中的图片。但是,由于 HTML 和 PDF 的格式差异,可能会遇到图片不显示的问题。为了解决这个问题,本文将介绍使用 iText 和 Flying...

    Img图像文件格式解析及读取

    本文将深入探讨"Img"图像文件格式的解析和读取,这是计算机图形学、软件开发和图像处理中的一个核心概念。 Img文件格式并不常见,它通常与特定的硬件或软件应用相关,例如在嵌入式系统、游戏开发或者遥感图像处理...

    用JAVA实现远程图片批量下载

    2. **图片链接识别**:在读取的HTML文档中识别出&lt;img&gt;标签,提取出图片的URL地址。 3. **多线程下载**:为每一个图片URL创建一个独立的线程进行下载,以提高效率。 4. **URL管理**:为了防止重复下载和提高效率,...

    相对路径和img标签demo

    本压缩包“相对路径和img标签demo”显然旨在演示如何在HTML文档中使用相对路径来引用图像,以及img标签的基本用法。让我们深入探讨这两个主题。 首先,我们来看**相对路径**。在HTML中,路径用于指示文件或目录的...

Global site tag (gtag.js) - Google Analytics