package import java.io.BufferedReader; import java.io.InputStream; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; /** * HttpConnection * @author * */ public class HttpConnectionUtil { /** * 通过url获取网络数据 * @param url 路径 * @return 字符串结果 */ public static String getInfoFromAddress(String url){ StringBuffer sb=new StringBuffer(); InputStream stream; String strLine = null; URL urL; try { urL = new java.net.URL(url); HttpURLConnection connection = (HttpURLConnection) urL.openConnection(); connection.connect(); stream = connection.getInputStream(); BufferedReader reader = new BufferedReader(new InputStreamReader(stream,"utf-8")); while ((strLine = reader.readLine()) != null) { sb.append(strLine); } } catch (Exception e) { e.printStackTrace(); } return sb.toString(); } }
相关推荐
下面我们将深入探讨URLConnection在客户端页面截取中的应用。 首先,URLConnection是java.net包中的一个抽象类,它是所有HTTP连接的基类,包括HTTP、HTTPS等多种协议。它提供了对URL的基本操作,如打开连接、发送...
### 图片转流存库和读取二进制流页面展示 #### 一、知识点概述 本文档将详细介绍如何在Java环境下实现图片转换为二进制流存储到数据库中的过程,以及如何从数据库中读取出这些二进制流并将其展示在网页上。主要...
import java.net.URLConnection; import java.io.*; public class JspToHtml { private static String title ="标题测试"; private static String context ="标题测试"; private static String editer ="标题...
这篇文章主要探讨如何利用`HttpURLConnection`访问Web页面并读取其内容。 首先,我们需要了解`URLConnection`类的作用。`URLConnection`是Java API中的一个抽象类,它为应用程序提供了与不同协议的URL(如HTTP、FTP...
这不仅有助于提高网站性能(因为静态页面加载更快),还能增强SEO效果,使得搜索引擎更容易抓取网站内容。本文将详细介绍一个Java程序,该程序能够将程序员编写的动态JSP页面最终生成为静态的HTML文件。 #### 关键...
URLConnection connection = url.openConnection(); ``` 3. **设置请求属性**(可选): 如果需要发送HTTP头信息,可以使用`setRequestProperty()`方法,比如设置User-Agent: ```java connection....
- 读取的数据被存储在`sTotalString`变量中,并通过`<%= sTotalString %>`在HTML页面中显示。 #### 五、注意事项 1. **安全问题**: - 直接抓取其他网站的内容可能会涉及到版权或法律问题,请确保你有权限这样做...
- `Parser(URLConnection connection)`:使用提供的URLConnection创建解析器。 2. **静态方法**: - `static Parser createParser(String html, String charset)`:基于给定的HTML字符串和字符集创建解析器。 3....
- 创建一个`InputStreamReader`对象读取页面内容。 - 使用自定义的`HTMLEditorKit`子类中的`getParser`方法获取HTML解析器。 3. **图片下载**:当解析出图片URL后,为每个图片创建一个独立的线程进行下载。在下载...
在服务器端,Java程序接收到POST请求后,会读取请求体中的XML数据。这通常涉及到XML解析。Java提供了DOM、SAX和StAX等多种解析器,可以根据需求选择合适的。例如,如果使用DOM解析,可以创建DocumentBuilderFactory...
然后,使用 `BufferedReader` 和 `BufferedWriter` 将网页内容读取并写入到一个指定的文本文件中。虽然这个示例实现了基本的网页抓取,但它要求用户手动输入URL,并且没有进行任何错误处理或重构。 HTMLParser 库...
在Java中,我们可以使用`java.net.URL`和`java.net.URLConnection`类,或者更现代的`HttpURLConnection`,或者第三方库如Apache HttpClient或OkHttp。以下是一个简单的示例,使用`HttpURLConnection`: ```java URL...
1. **建立连接**:首先通过`URL`对象和`URLConnection`类建立与目标JSP页面的连接。 ```java URL url = new URL(sSourceUrl); URLConnection urlconn = url.openConnection(); urlconn.connect(); ``` 2. **...
在实际应用中,通常通过 URLConnection 或字符串内容来初始化 Parser,这适用于从网络或本地文件中读取 HTML 内容。如果需要定制解析规则,可以使用 Lexer,但这需要更深入的理解。ParserFeedback 用于调试和跟踪...
HTMLParser 的核心类是 `org.htmlparser.Parser`,它负责处理 HTML 页面的解析工作。`Parser` 类提供了多个构造函数,以适应不同的初始化场景: 1. 默认构造函数 `public Parser ()` 创建一个空的解析器。 2. 带有 ...
- 例如,提取新闻列表中的新闻链接或新闻详情页面中的内容等。 示例: ```java String[] s = analysis("(.*?)</p>", getContent(URL), 30); ``` 这里 `(.*?)</p>` 是一个正则表达式,用来匹配 `<p>` 标签中的文本...
在 HTMLParser 中,`org.htmlparser.Parser` 类是核心组件,负责执行 HTML 页面的解析任务。它提供了多种构造函数供用户根据不同的情况选择: 1. `public Parser ()`: 创建一个默认的 Parser 实例。 2. `public ...