`
huxiuliang
  • 浏览: 119321 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

java提取html正文的图片代码

    博客分类:
  • Java
阅读更多
public static void main(String args[]){
    	
    	String regexImage = "<img.+?src=\"(.+?)\".+?/?>";   	
    	String ImageStr="";
    	String ImageSrcStr="";
    	String contentStr = "正文的String字符串";
    	
    	Pattern p = Pattern.compile(regexImage,Pattern.CASE_INSENSITIVE);
    	Matcher m = p.matcher(contentStr);
    	
        if(m.find()){
        	ImageStr = m.group();
        	ImageSrcStr = m.group(1);
        	System.out.println(ImageStr);
        	System.out.println(ImageSrcStr);
        }

    }
分享到:
评论
1 楼 hippo 2009-12-12  
有好几种方式还是匹配不到,例如:<img src= "aa.jpg"/><img src=aa.jpg /> <img src='aa.jpg' /> <img src="aa.jpg"/>等

这是我写的,可以参考以下
String regexImg = "<img.+?src\\s*=\\s*['|\"]?\\s*([^'\"\\s>]+).+?/?>?";

相关推荐

    java过滤html代码

    在Java编程中,"java过滤html代码"是一个常见的需求,主要目的是为了安全考虑,比如防止XSS(跨站脚本攻击)或者为了提取纯文本内容。这个任务可以通过使用正则表达式来实现,正如描述中提到的那样。下面我们将详细...

    Java html代码解析

    在IT领域,尤其是在Web开发和数据处理中,Java HTML代码解析是一个重要的技术环节。这个话题主要涉及如何使用Java处理HTML文档,提取其中的数据或者进行内容分析。本文将深入探讨Java库Jsoup及其在HTML解析中的应用...

    Java网络爬虫及正文提取

    4. **正文提取**:提取HTML正文涉及到对网页结构的理解。正则表达式在此环节扮演重要角色,可以用来匹配和提取非正文部分(如广告、脚本、样式等)并删除它们,留下主要的内容。例如,可以使用正则表达式去除`...

    以图搜图Java+html源代码

    【以图搜图Java+html源代码】是一个项目,它结合了Java和HTML技术来实现一个功能,允许用户通过上传一张图片来搜索相似的图片。这个功能在许多领域都有应用,比如搜索引擎、图像识别和社交媒体。下面将详细介绍这个...

    java下载网站图片的爬虫代码

    在这个"java下载网站图片的爬虫代码"中,开发者可能使用了Jsoup库来解析HTML文档,因为它提供了简洁的API来提取和操作结构化数据。例如,可以通过选择器语法找到`&lt;img&gt;`标签,进而获取`src`属性中的图片URL。 下载...

    提取文件中百度云链接与提取码的java源码

    这个文件可能是Java源代码,用于将从网页抓取的原始链接和提取码数据进行整理和转换,以便后续的下载过程。 总之,通过Java编程,结合`Jsoup`库,我们可以有效地从网页中提取百度云的链接和提取码,进而实现批量...

    java后台html 转excel

    综上所述,"java后台html转excel"的技术涵盖了HTML解析、数据提取、Excel文件生成、数据映射与格式化等多个环节。虽然这个技术可能还有待完善,但通过学习和实践,可以构建出稳定、高效的解决方案。在实际开发中,应...

    java代码文件转HTML

    本项目专注于解决如何使用Java语言将C和Java代码文件转换为带有高亮显示的HTML文件。下面将详细阐述这个过程涉及的关键知识点。 首先,我们需要理解正则表达式(Regular Expression,简称regex)的作用。正则表达式...

    java获取网网页中出现的图片及判断网页代码中是否包含有效图片

    4. **正则表达式匹配图片链接**:为了从HTML源码中提取图片链接,可以使用正则表达式进行匹配。例如,可以使用以下正则表达式来匹配`src`和`background`属性中的图片链接: ```java String searchImgReg = "(?x)...

    java转化成html html转java

    3. **正则表达式**:在一些简单场景下,可以用正则表达式匹配并提取HTML中的特定字符串。 4. **XML DOM解析**:HTML可以视为XML的一种,因此也可以使用XML解析库如JDOM或DOM4J来处理HTML。 5. **网络爬虫**:在大...

    提取网页前台图片和文本

    2. **XML解析**:用于从富文本编辑器输出的HTML代码中提取图片和文本内容。 #### 三、正则表达式提取图片 在本例中,使用了`System.Text.RegularExpressions`命名空间下的`Regex`类来编写正则表达式,以匹配并提取...

    JAVA BBS系统源代码.zip

    【JAVA BBS系统源代码.zip】是一个包含Java编程语言实现的论坛系统源代码的压缩文件。这个系统可能是一个在线讨论平台,用户可以在这里发布话题、回复、进行互动。通过研究和学习这个源代码,开发者可以深入理解如何...

    java日语版js验证图片预言

    这意味着压缩包内包含了与Java和JavaScript相关的源代码文件,如.java文件(Java源代码)、.js文件(JavaScript代码),可能还有HTML文件(网页结构)、CSS文件(样式定义)和其他资源文件(如图片、字体等)。...

    Java实现从Html文本中提取纯文本的方法

    这种技术在实际应用中非常有用,例如从网页中提取文章内容、从Html邮件中提取正文等。 应用场景: 1. 从Html文件中提取纯文本 2. 从String(Html内容)中提取纯文本 代码一:使用replaceAll方法提取纯文本 ...

    Java源码包100个设计实例.zip

    Java半透明图片实现的步骤及源代码.rar Java右键弹出菜单源码 Java吃豆子游戏源代码.rar Java图片加水印,支持旋转和透明度设置 Java圆形按钮实例代码,含注释 Java圆形电子时钟源代码 Java多用户聊天室程序(毕业...

    java mail课本源代码java web

    这个压缩包文件包含了与Java Mail相关的源代码,可能是从郝玉龙编著的《Java EE编程技术》一书中提取的示例代码。 Java Mail API 提供了丰富的类和接口,使得开发者能够方便地执行各种邮件操作,包括创建、发送、...

    word内容提取 word转html-POI wps doc docx转html

    - 组合HTML代码,生成最终的HTML文件。 6. **前端HTML**:转换后的HTML文件可以直接在网页中展示,前端开发人员可以使用CSS进行进一步的美化和布局调整。对于复杂的样式,可能需要使用JavaScript库如jQuery或现代...

    java源码包---java 源码 大量 实例

     Java绘制图片火焰效果,源代码相关注释:前景和背景Image对象、Applet和绘制火焰的效果的Image对象、Applet和绘制火焰的效果的Graphics对象、火焰效果的线程、Applet的高度,图片到图片装载器、绘制火焰效果的X坐标...

    java上传图片到七牛云 七牛云 七牛 图片上传 demo JS java

    在本文中,我们将深入探讨如何使用Java和JavaScript将图片上传到七牛云存储服务。七牛云是一个提供云端存储和CDN加速的平台,广泛应用于图片、视频等多媒体资源的托管。图片上传功能是其核心服务之一,为开发者提供...

    EPUB 解析 (java)

    Java解析模块会将这些内容解压、提取,并可能进行进一步的处理,如图像的重命名和移动,以适应不同的设备和阅读环境。 在FBreader的优化版本中,可能包括了性能提升、内存管理优化、错误修复或新特性添加。例如,...

Global site tag (gtag.js) - Google Analytics