public void getHTMLSrc(String url){
InputStream openStream = null;
BufferedReader buf = null;
try {
String line = null;
URL theUrl= new URL(url);
openStream = theUrl.openStream();
//<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
//构建输入流的的字符集必须和HTML源码中的 charset一致
buf = new BufferedReader(new InputStreamReader(openStream,"utf-8"));
while((line = buf.readLine()) != null){
System.out.println(line);
}
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally{
try {
if(openStream!=null){
openStream.close();
}
if(buf!=null){
buf.close();
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
分享到:
相关推荐
解决Java读取CSV文件中文乱码问题的步骤如下: 1. **指定字符编码**:在使用`BufferedReader`或者`FileReader`读取文件时,应明确指定编码。例如,使用`InputStreamReader`构造函数可以传入编码类型,如`new ...
在Java编程语言中,开发一个图形用户界面(GUI)来获取网页源代码涉及到多个关键知识点。这个项目使用了Java Swing库来创建JFrame窗口,并利用Java的网络编程能力来抓取网页内容。以下是对这些技术的详细解释: 1. ...
本节将详细介绍如何正确地读取网页源码,避免出现乱码,并特别关注在处理压缩文件格式时的源代码读取。 首先,我们需要了解网页源码的获取方式。在Java中,我们可以使用`java.net.URL`和`java.io.InputStreamReader...
要解决Java读取TXT文件中文乱码的问题,关键在于指定正确的编码方式。以下是使用`BufferedReader`和`FileReader`读取UTF-8编码的TXT文件的示例: ```java import java.io.BufferedReader; import java.io....
总结,解决JAVA反编译文件时的中文乱码问题,关键在于确定源代码的原始编码,并确保反编译工具支持该编码。同时,良好的编码规范和项目配置也是避免此类问题的重要措施。通过上述方法,开发者可以更顺利地进行Java反...
本文将详细讲解如何在Android应用中以GET方式读取网页源代码,并解决可能出现的乱码问题。 首先,我们需要理解HTTP协议中的GET方法。GET是最基本的HTTP请求方法,它向服务器请求指定资源。在Android中,我们通常...
使用`javac`编译Java源文件时,可以添加`-encoding`参数指定源代码的编码,如`javac -encoding UTF-8 YourFile.java`。 总的来说,解决Java中的中文乱码问题需要从多方面考虑,包括文件操作、网络通信、数据库交互...
网页源码采集器是用于获取网页内容的重要工具,尤其在处理不同编码格式的网页时,可能会遇到乱码问题。本文将深入探讨如何解决GB2312和UTF-8编码导致的乱码问题,以及如何利用VB编程语言和XMLHTTP组件来实现高效、...
了解了这些基础知识后,我们就能有效地处理Java读取文件时可能出现的乱码问题。在编写代码时,始终注意文件编码的设定,尤其是在处理跨平台或多语言内容时,使用Unicode(如UTF-8)作为标准编码通常是个好选择。通过...
5. **配置IDE**:如果你是在IDE中开发,如Eclipse或IntelliJ IDEA,可以设置项目或文件的编码为UTF-8,确保源代码中的字符串不会因编码问题导致乱码。 6. **处理字符集转换**:如果文件编码未知,可以尝试使用`...
在**Eclipse**这样的Java开发环境中,源代码文件默认通常是UTF8编码,因为UTF8能更好地支持国际化,包括中文在内的多语言字符都能正确显示。然而,如果源代码文件原本是GBK编码,Eclipse无法识别这种格式,就会出现...
在本教程中,我们将深入探讨如何在Android应用中正确地以GET方式读取网页源代码,并解决可能出现的编码错误导致的乱码问题。 首先,我们需要使用`HttpURLConnection`或者第三方库如`Volley`、`OkHttp`来发起...
总结,解决Java读取文件时的乱码问题,关键在于明确文件的编码格式并正确地在代码中指定。通过使用不同的IO类库和工具,以及自定义的编码检测方法,我们可以有效地处理各种编码的文件,确保数据的正确性。
NULL 博文链接:https://liuzidong.iteye.com/blog/776637
java基于高德地图实现实时查询天气功能源代码。基于高德地图实现实时查询天气功能,api二次开发java基于高德地图实现实时查询天气功能源代码。基于高德地图实现实时查询天气功能,api二次开发java基于高德地图实现...
在Android开发中,获取网页源码是一项常见的任务,它能够帮助开发者分析网页内容、抓取数据或者实现自动化操作。本文将详细介绍如何在Android环境中通过异步处理来获取任意网页的HTML源码。 首先,我们需要引入必要...
综上所述,解决Java中文乱码问题的关键在于确保整个程序的编码一致性,包括源代码、编译器、运行环境、文件读写、网络传输以及数据库操作等环节。通过细心配置和适当地指定编码,我们可以有效地避免乱码问题,确保...
Java编程语言在处理中文字符时可能会遇到乱码问题,这主要源于Java的源代码编码、JVM处理class文件以及不同操作系统、数据库系统之间的编码不一致。本文深入剖析了Java中文问题的根源,并提供了相应的解决方案。 一...
7. 源码文件编码:确保所有源代码文件使用同一编码,推荐使用UTF-8,这样能避免因源码编码问题引发的编译期乱码。 通过以上方法,我们可以有效地防止和解决Java中的中文乱码问题。然而,每个具体问题可能需要针对性...