import java.util.regex.Matcher;
import java.util.regex.Pattern;
//1:这个是拿到一个字符取得里面的图像地址返回一个List
public static List<String> getImgStr(String htmlStr){
String img="";
Pattern p_image;
Matcher m_image;
List<String> pics = new ArrayList<String>();
String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址
p_image = Pattern.compile
(regEx_img,Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while(m_image.find()){
img = img + "," + m_image.group();
Matcher m = Pattern.compile("src=\"?(.*?)(\"|>|\\s+)").matcher(img); //匹配src
while(m.find()){
pics.add(m.group(1));
}
}
return pics;
}
//2:下面是获得第一个地址存入到数据库
public String saveOrUpdate()
{
try{
if(infoId !=null){
infoTpicnew = infoTpicnewService.getInfoTpicnew(infoId);
}else{
infoTpicnew.setInfoDatetime(new Date());
}
infoTpicnew.setInfoContent(infoContent);
List list =getImgStr(infoContent);
infoTpicnew.setInfoPicname((String) list.get(0));
infoTpicnewService.saveOrUpdateInfoTpicnew(infoTpicnew);
return SUCCESS;
} catch (Exception e) {
e.printStackTrace();
return INPUT;
}
}
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/lancijk/archive/2010/03/17/5389394.aspx
分享到:
相关推荐
4. **正则表达式匹配图片链接**:为了从HTML源码中提取图片链接,可以使用正则表达式进行匹配。例如,可以使用以下正则表达式来匹配`src`和`background`属性中的图片链接: ```java String searchImgReg = "(?x)...
本文详细介绍了如何使用.NET平台的技术栈来实现从网页中提取图片和文本,并对其进行分离处理。通过这种方式,可以高效地获取网页中的有用信息,并为进一步的数据分析和处理提供基础。此外,还可以根据实际需求进一步...
java的封装类,可以从指定网络地址,抓取地址中的网页,并分析抓取图片地址,下载到本地
总的来说,要从IPA文件中提取并解码PNG图片,需要熟悉Java的文件操作、压缩包处理、图像解码等相关知识。这个过程涉及到了多个技术层面,通过合理利用Java提供的API和第三方库,我们可以实现跨平台的图像处理,使得...
### Java抓取网页图片链接地址 #### 知识点概览 本文将详细介绍如何使用Java编程语言抓取网页上的图片链接。此技术广泛应用于网络爬虫、数据分析等领域,能够帮助开发者快速获取所需的图像资源。 #### 技术背景与...
在这个场景中,我们将重点讨论如何使用Java POI读取Word文档并将其内容转换为HTML网页,同时确保图片和公式等复杂元素能够正确显示。 首先,你需要在你的Java项目中引入Apache POI库。可以通过Maven或Gradle来添加...
接下来,我们要讨论如何从HTML中提取图片链接。HTML中的图片通常由`<img>`标签表示,其`src`属性包含图片的URL。使用Jsoup,我们可以选择所有的`<img>`标签,然后获取每个标签的`src`属性值,从而得到图片的URL列表...
2. **HTML解析**:抓取到的网页内容通常是HTML格式,因此需要解析HTML来提取图片信息。Java提供了多种库,如Jsoup,用于解析HTML文档,找出图片链接。 3. **Jsoup库**:Jsoup是一个强大的Java库,它允许开发者以DOM...
在Java编程语言中,截取指定网页并保存为图片是一项常见的需求,比如用于网页快照、自动化测试或者数据抓取等场景。实现这个功能通常涉及网络请求、网页解析以及图像处理等多个方面。以下是一个详细的步骤解析: 1....
以上是构建一个简易Java网页浏览器涉及的主要技术点,每个点都需要深入理解和实践。实际开发中,还可以考虑添加更多高级功能,如页面预加载、多标签页、下载管理等,以增强浏览器的功能和用户体验。
在互联网开发中,有时我们需要将整个网页(包括其所有资源如图片、样式表、脚本等)保存为一个单一的文件,以便于离线浏览或备份。MHT(MIME HTML)格式是一种将网页及其所有相关资源封装在一个文件中的标准格式,它...
首先,我们要知道Java中的Swing或JavaFX库可以用来创建GUI组件,比如浏览器的地址栏、前进/后退按钮、书签功能等。Swing是Java早期的GUI工具包,而JavaFX提供了更现代、更丰富的图形效果和动画支持。在这个项目中,...
在IT行业中,将HTML页面转换为图片是一种常见的需求,例如用于网页截图或者生成预览图。Java作为一种强大的后端开发语言,提供了多种方法来实现这一功能。本篇将详细讲解如何利用Struts2框架,结合Java的相关技术,...
改程序利用htmlParser这个jar包实现了对网页的解析,实现了对网址,网页的标题,网页上的图片,网页的内容的额入库操作。使用mySQL数据库。但是,在网页内容的提取方面还有很多的问题,毕竟各个网页的风格不一样,...
本文主要介绍如何使用正则表达式来从文本中提取图片。正则表达式是一种强大的文本处理工具,被广泛应用于搜索、替换以及数据提取等场景。对于网页开发或者数据分析来说,能够熟练地运用正则表达式提取图片是非常有用...
这个【标题】"java将网页保存成mht格式文件"指向的是一个Java项目,其目的是将网页转换为MHT格式,以便离线查看或保存网页的原始状态。 在Java中实现这个功能,通常需要以下步骤: 1. **抓取网页内容**:首先,你...
2. **图片链接识别**:在读取的HTML文档中识别出标签,提取出图片的URL地址。 3. **多线程下载**:为每一个图片URL创建一个独立的线程进行下载,以提高效率。 4. **URL管理**:为了防止重复下载和提高效率,需要维护...
在这个“正则函数提取图片地址”的例子中,我们主要关注如何使用正则表达式来从HTML文本中提取出图片的URL地址。这对于网页解析、数据抓取或者内容管理等场景尤其有用。 首先,我们要理解HTML中的图片标签`<img>`的...
然而,由于题目要求从这段信息中提取出与“网页设计Java代码”相关的知识点,我们可以通过这段HTML代码来探讨一下如何在网页设计中运用Java技术,以及如何在实际开发中将Java与HTML相结合。 ### 一、理解HTML代码 ...
在"压缩包子文件的文件名称列表"中,只给出了"java+js",这意味着压缩包内包含了与Java和JavaScript相关的源代码文件,如.java文件(Java源代码)、.js文件(JavaScript代码),可能还有HTML文件(网页结构)、CSS...