获取html代码如下:
public class MyBrowser {
public static void main(String[] args) {
try {
java.net.URL url = new java.net.URL("http://edu.daynews.com.cn/jyxw/list.html");
java.net.URLConnection conn = url.openConnection();
conn.connect();
System.out.println("" + conn.getContentType());
System.out.println("" + conn.getContentEncoding());//获取页面编码
System.out.println("" + conn.getContentLength());
System.out.println("" + conn.getDate());
System.out.println("" + conn.getExpiration());
System.out.println("" + conn.getLastModified());
StringBuffer contentBuffer = new StringBuffer();
java.io.InputStream is = conn.getInputStream();
//java.io.BufferedReader reader = new java.io.BufferedReader(new java.io.InputStreamReader(is, conn.getContentEncoding()));
java.io.BufferedReader reader = new java.io.BufferedReader(new java.io.InputStreamReader(is));
String inputLine = null;
while ((inputLine = reader.readLine()) != null) {
contentBuffer.append(inputLine);
contentBuffer.append("\n");
}
is.close();
System.out.println("" + contentBuffer.toString());
} catch (java.net.MalformedURLException e) {
e.printStackTrace();
} catch (java.io.IOException e) {
e.printStackTrace();
}
}
}
但是用以上方法获取的页面编码总是null,所以不能用获取到的页面编码来构建InputStreamReader对象,不明白原因在哪里?
分享到:
相关推荐
本项目利用Java、FFmpeg和JavaCV库,实现了无控件HTML页面的视频实时预览和录像功能,主要涉及到的技术点如下: 1. **RTSP(Real-Time Streaming Protocol)协议**:RTSP是一种应用层协议,用于控制多媒体数据的...
### Java字符串编码转换详解 #### 一、Java 字符串编码转换基础 在Java中,字符串的处理是非常常见的操作之一,而字符编码是确保数据正确显示的关键因素。本篇文章将重点介绍Java中字符串编码的转换方法及其在Web...
2. 如果HTML页面使用的编码是GBK,则需要转换编码: ```java String username = new String(request.getParameter("username").getBytes("GBK"), "UTF-8"); ``` 通过以上方法,可以在Java应用中有效地管理字符...
根据给定的文件信息,我们将深入探讨如何使用Java语言读取网页并生成静态HTML页面,同时理解其背后的原理和技术要点。 ### 核心知识点:Java读取网页与生成页面 #### 1. Java网络编程基础 Java提供了丰富的API来...
例如,可以执行一个JavaScript脚本来获取网页的canvas元素,然后调用`toDataURL()`方法将canvas内容转换为Base64编码的图像数据。 5. **处理图像数据**:在Java端接收到Base64编码的图像数据后,将其解码并保存为...
JSP(JavaServer Pages)是一种动态网页技术,它允许开发者在HTML页面中嵌入Java代码,以实现服务器端的数据处理和逻辑控制。然而,由于涉及到多种编码标准和传输过程,编码问题可能导致乱码的出现。为了解决这些...
- 在处理HTML时需要注意编码问题,可以通过`getEncoding()`方法确定正确的编码格式。 5. **资源文件的存储**: - 创建一个新的目录(如果不存在的话),用于存放从MHT文件中提取出来的资源文件。 - 将资源文件...
### JSP用户提交页面编码 在Java Web开发中,尤其是使用JSP(JavaServer Pages)技术进行网页开发时,处理用户提交的数据是非常重要的一个环节。其中,数据编码问题尤为关键,因为错误的编码设置可能会导致乱码问题...
Java 抓取与采集页面内容是一项常见的任务,特别是在大数据分析、搜索引擎优化(SEO)和网络监控等领域。这个压缩包中的两个文件,`HttpCon.java` 和 `ChunkedInputStream.java`,可能包含了实现这一功能的基本组件...
JavaScript库如jQuery提供了方便的API来发送异步请求到服务器获取新验证码,并更新页面上的验证码图片。 5. **响应与重定向**: - **HTTP响应**:服务器生成新验证码后,会构建一个包含验证码的HTTP响应,并返回给...
1. 加载HTML内容:这可以是从文件读取,也可以是从网络获取。确保内容包含正确的字符编码。 2. 创建`Pd4mlDocument`对象,这是pd4ml的核心类,用于处理HTML和PDF的转换。 3. 设置PDF生成的参数,如页面大小、边距...
在JavaWeb开发中,页面编码过滤是一个至关重要的环节,它主要解决的是网页中字符编码不一致导致乱码的问题。在给定的标题“JavaWeb页面过滤器之编码过滤”和描述中,我们可以深入探讨JavaWeb中的编码过滤器,以及...
在Java编程中,生成静态页面是一种常见的技术,它涉及到网页内容的抓取和存储。这个程序的主要目的是从指定的URL抓取网页内容,并将其保存为一个HTML文件,即静态页面。下面将详细讲解这个过程涉及的关键知识点。 1...
4. **验证并跳转**:手机扫描二维码后,将获取的内容与预设的目标网址进行比对,如果匹配则打开浏览器跳转。 ```java public void verifyAndRedirect(String scannedContent, String targetUrl) { if ...
- RESTful API:使用Java开发的RESTful服务可以提供编辑器所需的接口,用于获取、保存或处理HTML内容。 - 安全性:Java后端可以进行安全性检查,防止XSS(跨站脚本攻击)和其他恶意代码注入。 4. **对初学者的...
Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...
例如,JChm库可以用来读取CHM文件的索引,获取HTML页面的二进制内容,然后将其转换为文本。 3. **CHM解码**:CHM文件使用LZ77压缩算法和MSHF加密方法。解码过程包括解密数据、解压内容以及处理编码问题,如UTF-16LE...
- 后端Java主要负责数据的获取和处理。开发者可能使用Servlet或者Spring MVC等框架来接收前端的请求,查询数据库获取部门信息。 - 数据库设计:通常需要一个部门表,包含部门ID、部门名称、上级部门ID等字段,通过...
- **环境和IDE的使用**:建议使用稳定的Java开发环境,如Eclipse、IntelliJ IDEA,并保持IDE的更新,以获取最新的功能和修复。同时,确保安装必要的插件,如Checkstyle、SonarQube,它们可以帮助检查代码是否符合...
在Java编程环境中,将一个URL链接的内容转换为PDF文件是一个常见的需求,这通常涉及到网络请求、HTML解析以及PDF生成等多个步骤。以下是一个详细的步骤指南,涵盖了这个过程中的关键知识点: 首先,我们需要处理URL...