`

java 日志页面展示 抓取远程的文件

    博客分类:
  • java
 
阅读更多

/**

* 抓取远程的文件

* @param url

* @return

* @throws IOException

*/

public static String getLogContent(String url) {

StringBuffer sb = new StringBuffer();

URL HttpUrl;

HttpURLConnection con = null;

BufferedReader reader = null;

try {

HttpUrl = new URL(url);

con = (HttpURLConnection) HttpUrl.openConnection();

if (con.getResponseCode() != con.HTTP_OK) return "";

reader = new BufferedReader(new InputStreamReader(con.getInputStream(), "UTF-8"));

String line = null;

while ((line = reader.readLine()) != null) {

sb.append(line);

sb.append("\n");

}

 

} catch (Exception e) {

e.printStackTrace();

} finally {

try {

if (reader != null)

reader.close();

if (con != null) {

con.disconnect();

}

} catch (Exception e) {

e.printStackTrace();

}

}

return sb.toString();

}

 

分享到:
评论

相关推荐

    log4j,日志——日志抓取

    总结,Log4j作为Java日志框架的代表,不仅提供了丰富的功能,而且具备高度可扩展性,使得开发者能够根据项目需求定制自己的日志系统。理解并熟练运用Log4j,对于优化应用程序和解决故障具有极大的帮助。

    java jsoup应用爬取数据存储数据库及日志开关

    日志信息可以写入控制台、文件,甚至发送到远程服务器。例如,使用Log4j,可以在配置文件中指定日志级别和输出目的地: ```xml ``` 在这个配置中,日志会被记录到指定文件,且只有INFO及以上级别...

    开源爬虫java文件.zip

    2. **文件系统爬取**:filecrawler4j库可能提供了遍历文件系统、处理目录结构、获取文件信息以及下载文件的功能,这对于需要抓取本地或远程服务器上文件的爬虫项目尤为重要。 3. **日志管理**:在开发过程中,日志...

    java实现的远程桌面监控.rar

    Java实现的远程桌面监控系统是一种基于客户端-服务器(Client-Server,CS)架构的技术,它允许用户通过网络从一个地方访问并控制另一个地方的计算机。这个技术在IT管理、技术支持和远程协作等领域有着广泛的应用。...

    java远程控制系统.zip

    此外还有一些辅助功能包括脚本,网页爬虫,本地日志的记录,远程日志的收集与合并功… 爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示...

    远程桌面控制j(ava程序)

    在Java中,java.awt.Toolkit和java.awt.image.BufferedImage类可以用来抓取屏幕快照。首先,通过Toolkit.getDefaultToolkit().getScreenSize()获取屏幕尺寸,然后创建相应大小的BufferedImage对象,调用Graphics类的...

    Android Logcat 抓取调试工具

    2. **启动和停止日志抓取**:工具提供开始和停止按钮,你可以随时开始或结束日志的抓取。 3. **过滤日志**:你可以输入关键字或过滤表达式来筛选特定的日志条目。这对于查找特定应用或类的错误信息非常有用。 4. *...

    jsch连接日志流读写实时传输代码

    `JSch`是一个Java实现的SSH(Secure Shell)库,允许我们通过SSH协议进行安全的远程操作,包括文件传输和命令执行。在这个项目中,`jsch`被用于实现实时的日志流读写,确保数据的安全性和实时性。 首先,`...

    Java 程序员眼中的 Linux.zip

    在Java程序员的眼中,Linux不仅是开发环境的一部分,更是部署、测试和生产环境中不可或缺的操作系统。Linux以其开源、稳定和高效的特点,深受IT界的青睐。本资料包“Java程序员眼中的Linux.zip”提供了一份全面的...

    java技术点

    【Java技术点】涵盖的内容广泛,从初级到高级,涵盖了编程基础、Web开发、框架使用、数据处理、安全防范等多个方面。以下将按照知识等级进行详细的解析: **初级知识点** 1. **SVN环境搭建**:版本控制系统,用于...

    70个JAVA问答.txt

    根据给定文件的信息,我们可以提炼出以下详细的Java知识点: ### 1. 在不同操作系统上执行命令 在Java中,可以通过`System.getRuntime().exec(command)`来执行操作系统级别的命令。例如,在Linux系统中,如果想要...

    基于Java的爬虫框架WebMagic.zip

    WebMagic的核心组件包括四个部分:PageFetcher(页面抓取)、PageProcessor(页面处理)、Scheduler(调度器)和Pipeline(数据存储)。下面将详细介绍这些组件以及如何使用它们来构建一个爬虫。 1. **PageFetcher*...

    mavenproject工程列表说明1

    在本文中,我们将深入探讨基于Maven构建的Java Web项目中的各种技术知识点,这些知识点涵盖了配置文件处理、HTML操作、编码解码、日志框架、数据库交互、网络请求以及分布式系统等多个领域。 1. **Apache Commons ...

    java 屏幕分享软件 源码

    它允许用户通过网络共享自己的桌面,使远程协作和演示变得更加便捷。描述中提到,软件的功能包括“共享桌面”以及“连接他人屏幕”,虽然可能存在一定的延迟问题,但整体上仍能实现基本的屏幕共享功能。 1. **Java...

    基于Java的气象管理系统设计.zip

    9. **错误处理和日志记录**:Java的Exception Handling机制用于捕获和处理程序运行时的错误,而Log4j、SLF4J或Logback用于记录系统日志,便于调试和问题排查。 10. **测试与部署**:单元测试、集成测试和压力测试是...

    heritrix-1.14.0-src

    4. **存档模块(Archiving Modules)**:保存抓取到的数据,可以是本地文件系统、数据库或远程存档服务。Heritrix提供了多种存档策略,比如基于文件系统的存档、Warc格式的存档等。 5. **配置与扩展**:Heritrix的...

    Heritrix用户参考手册

    除了通过Web界面管理作业,Heritrix还支持一系列高级功能,如生成抓取结果文件、恢复队列状态、设置检查点、远程监控与控制、FTP支持等。这些功能通过脚本、命令行工具和外部API实现,为高级用户提供更多定制化选项...

    图书大数spark java echarts图书大数据爬虫 mysql 包调试文档web 报告据.rar

    Python的Scrapy框架或者Java的Jsoup库是常见的选择,它们可以帮助我们高效地抓取和解析网页内容。了解如何设计合理的爬虫结构,避免反爬策略,以及如何存储和清洗抓取的数据,都是这部分的重点。 MySQL数据库作为...

    基于Java 的网络蜘蛛系统的设计与实现

    本文主要探讨了如何运用Java语言设计并实现一款能够抓取网络资源的网络蜘蛛(也称为网络爬虫)。该系统可以从一个指定的入口网址出发,遍历并抓取整个互联网上的资源,将这些资源下载至本地存储设备中,随后可以通过...

    Heritrix1.14.4

    7. **日志与报告**:Heritrix生成详细的日志文件,记录了爬虫的活动信息,包括成功和失败的请求、耗时等,帮助用户追踪和诊断问题。此外,它还能生成抓取报告,显示爬取的进度和结果。 8. **社区支持**:作为开源...

Global site tag (gtag.js) - Google Analytics