`
jickcai
  • 浏览: 243017 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

java抓取文件保存到本地

    博客分类:
  • java
阅读更多
改自:
http://www.zhenhua.org/article.asp?id=378

package util;
import java.io.*;
import java.net.*;

public class ImageDownload {
public boolean saveUrlAs(String photoUrl, String fileName) {
//此方法只能用于HTTP协议
try {
URL url = new URL(photoUrl);
HttpURLConnection connection = (HttpURLConnection) url.
openConnection();
DataInputStream in = new DataInputStream(connection.getInputStream());
DataOutputStream out = new DataOutputStream(new FileOutputStream(fileName));
byte[] buffer = new byte[4096];
int count = 0;
while ((count = in.read(buffer)) > 0) {
out.write(buffer, 0, count);
}
out.close();
in.close();
return true;
} catch (Exception e) {
return false;
}
}

public String getDocumentAt(String urlString) {
//此方法兼容HTTP和FTP协议
StringBuffer document = new StringBuffer();
try {
URL url = new URL(urlString);
URLConnection conn = url.openConnection();
BufferedReader reader = new BufferedReader(new InputStreamReader(conn.getInputStream()));
String line = null;
while ((line = reader.readLine()) != null) {
document.append(line + "\n");
}
reader.close();
} catch (MalformedURLException e) {
System.out.println("Unable to connect to URL: " + urlString);
} catch (IOException e) {
System.out.println("IOException when connecting to URL: " +
urlString);
}
return document.toString();
}

public static void main(String[] args) throws IOException {
ImageDownload imageDownload = new ImageDownload();
String photoUrl = "http://ad4.sina.com.cn/200601/12/43932_750450.jpg";
String fileName = photoUrl.substring(photoUrl.lastIndexOf("/"));
String filePath = "f:/";
boolean flag = imageDownload.saveUrlAs(photoUrl, filePath + fileName);
System.out.println("Run ok!\nGet URL file " + flag);
}
}
分享到:
评论

相关推荐

    java下载网络图片到本地保存

    在Java编程中,下载网络图片并将其保存到本地是一个常见的任务,特别是在开发涉及网页抓取、数据备份或者网络资源管理的项目中。这个过程通常包括以下几个步骤:建立网络连接、发送请求、接收响应数据以及将数据保存...

    Java实现网页抓取

    6. **数据存储**:抓取的数据通常需要保存到本地文件或数据库中。Java的标准库提供了文件I/O操作,如`java.io.File`和`java.nio.file`,数据库操作则可以使用JDBC(Java Database Connectivity)。 7. **延迟和速率...

    基于海康sdk的java程序摄像头实时抓拍图片保存到本地.zip

    标题中的“基于海康sdk的java程序摄像头实时抓拍图片保存到本地”表明这是一个使用海康威视(Hikvision)提供的SDK进行Java编程的项目,目的是实现通过摄像头实时捕获图像并将其保存到本地计算机的功能。这个项目是...

    基于java爬取网络图片并且保存到本地

    这个项目“基于Java爬取网络图片并且保存到本地”旨在为初学者提供一个学习实践的机会,了解如何利用Java进行网页抓取和数据处理。 首先,我们需要了解Java爬虫的基础。这通常涉及以下几个关键概念: 1. **HTTP...

    利用ffmpeg实现RTSP,RTMP推流以及保存到本地录像文件

    demo目录是简单的调用例子,简单实现了抓取屏幕然后推流到RTSP,RTMP服务器,以及保存到本地。 bin目录是已经编译好的二进制文件. 有兴趣可查看BLOG: https://blog.csdn.net/fanxiushu/article/details/80996391

    java抓取网页内容--生成静态页面

    总结来说,这个Java程序实现了从互联网上抓取网页内容,然后将内容保存为本地的HTML文件,即静态页面。这个过程涉及到网络请求、数据读取、字符编码转换以及文件操作等多个核心Java技术。在实际应用中,这样的功能...

    java抓取网页内容源代码

    ### Java抓取网页内容源代码解析与扩展 在IT领域,网页抓取(或称网络爬虫)是一项关键技能,广泛应用于数据收集、市场分析、搜索引擎优化等多个方面。本篇文章将深入探讨一个Java编写的网页内容抓取代码,旨在帮助...

    Java抓取百度图片

    5. **下载图片**:遍历图片URL列表,对每个URL发起一个新的GET请求,然后将响应流保存到本地文件系统,以完成图片下载。 6. **错误处理和优化**:考虑可能的网络错误,如超时、重定向等,并添加适当的异常处理。...

    java将网页保存成mht格式文件

    这个【标题】"java将网页保存成mht格式文件"指向的是一个Java项目,其目的是将网页转换为MHT格式,以便离线查看或保存网页的原始状态。 在Java中实现这个功能,通常需要以下步骤: 1. **抓取网页内容**:首先,你...

    java URL转PDF文件(完美支持中文)

    在Java编程环境中,将URL内容转换为PDF文件是一项常见的需求,尤其在数据抓取、文档保存或自动化报告生成等场景中。"java URL转PDF文件(完美支持中文)"的主题着重于如何利用Java库来实现这一功能,并且确保中文字符...

    使用SDK抓取海康威视录像机图片及视频流实时显示

    在本文中,我们将深入探讨如何使用Java语言配合海康威视的SDK来抓取NVR(网络视频录像机)的图片和视频流,并实现实时显示。海康威视是全球知名的安防监控设备制造商,其提供的SDK允许开发者进行深度集成和定制化...

    微信聊天数据抓取工具.zip

    5. 存储与导出:抓取完成后,数据通常会被保存为CSV、JSON或其他格式的文件,方便进一步查看和分析。 四、注意事项 1. 隐私与法规:在使用此类工具时,必须确保遵循当地法律法规,尊重他人隐私,不得非法获取或...

    java新闻抓取程序代码

    根据提供的文件信息,我们可以分析出该Java程序主要实现了新闻抓取功能,并且特别针对"http://weather.news.sina.com.cn/weather/news/index.html"这个网址进行抓取。以下将详细阐述此程序涉及的关键技术点: ### 1...

    java http方式抓取网页信息 JAVAIO

    本知识点主要探讨如何使用Java实现HTTP请求来抓取网页信息,并利用Java IO流将其保存到本地文件。首先,我们需要理解HTTP协议的基本概念,它是客户端与服务器之间交互的一种协议,通常用于获取HTML页面。 在Java中...

    使用Jsoup,抓取整个网站(包括图片、js、css)

    对于图片,我们使用`<img>`标签的`src`属性获取URL,然后使用Java的`HttpURLConnection`或第三方库如Apache HttpClient下载图片,保存到本地,并将`src`属性替换为本地路径。 对于CSS和JavaScript,情况类似。`...

    java爬虫,抓取网页图片

    这就涉及到Java的网络输入/输出流(InputStream/OutputStream),使用HttpURLConnection或HttpClient类来发送GET请求并保存响应的图片数据到本地。 6. **多线程**:为了提高爬虫效率,可以使用多线程同时下载多个...

    java下载图片文件

    在Java编程语言中,下载图片或文件是一项常见的任务,尤其在网络应用中,如网页抓取、数据备份或者用户请求下载等场景。这个“java下载图片文件”的项目可能包含了一个简单的实现,用于从指定URL下载图片或者其他...

    Java爬虫,信息抓取的实现 完整实例源码

    通常,抓取的信息会被保存在本地文件、数据库或云存储中。在本实例中,你可能会看到如何使用Java的I/O流来写入文件,或者使用JDBC与MySQL等数据库进行交互。 最后,要注意的是,合法和道德的爬虫实践非常重要。在...

    详解Java两种方式简单实现:爬取网页并且保存

    获取到输入流后,将其转换为字符串,最后将字符串保存到本地文件。 接下来是使用`HttpClient`的实现,它是Apache HTTP组件的一部分,提供了更高级别的HTTP客户端功能。以下是一个基本的使用示例: ```java import ...

    从远程 RSS 文件抓取

    其次,RSS阅读器会保存所有未读内容,即使用户几天没有查看,也不会错过任何更新。此外,RSS避免了电子邮件订阅带来的垃圾邮件问题,用户可以选择接收哪些信息,而不是被动接受。同时,RSS允许用户自定义新闻和内容...

Global site tag (gtag.js) - Google Analytics