`
shen211
  • 浏览: 47408 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

URL 获取网页内容乱码解决

    博客分类:
  • java
阅读更多
in = url.openStream();
			int all = url.openConnection().getContentLength();
			byte[] b = new byte[all];
    		int index = 0;
    		int count = in.read(b, index, all);
		    while (count != -1) {
		      index += count;
		      count = in.read(b, index, 1);
		    }
			String  str = new String(b, "gb2312");



注意:获取用byte读取内容,其他的如字符串读取,则不能解决问题
分享到:
评论

相关推荐

    java读取远程网页乱码解决方案

    在Java编程中,读取远程网页内容是一项常见的任务,但可能会遇到编码问题导致乱码。本文将深入探讨这个问题,提供有效的解决方案,确保正确地读取和处理远程网页的字符编码。 首先,理解网页编码至关重要。网页通常...

    获取网页内容的例子[解决中文乱码]

    获取网页内容的例子 绝对可以运行 各种编码的网页都可以正确获取 中文乱码不复存在

    windows xp 乱码解决文件

    "windows xp 乱码解决文件"这个主题主要涉及到字体文件的管理和使用,以改善系统的文本渲染能力,特别是针对那些不兼容系统默认字体的应用程序。 首先,我们需要理解“font”标签的含义。在计算机领域,字体是决定...

    Python BeautifulSoup中文乱码问题的2种解决方法

    使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输出的总是乱码,找了好久找到解决办法,下面分享给大家首先是代码复制代码 代码如下:from bs4 import BeautifulSoupimport urllib2url = ‘//www.jb51.net/...

    URL读取网页乱码.pdf

    在IT领域,尤其是在Web开发中,经常会遇到与字符编码有关的问题,例如“URL读取网页乱码”。乱码问题可能是由于编码不一致、解析错误或者是处理字符串的方式不当导致的。以下是一些关于如何理解和解决此类问题的关键...

    URL传中文参数导致乱码的解决方案之encodeURI

    在互联网应用中,URL(统一资源定位符)用于标识网页和其他网络资源的位置。然而,当URL需要传递包含中文字符的参数时,由于不同系统和环境的编码差异,可能会导致中文参数在传输过程中出现乱码。为了解决这个问题,...

    nutch部分网页乱码BUG修正

    4. **字符转换**:在获取网页内容后,Nutch需要将原始字节流转换为可读的字符串,这里就需要一个正确的字符集转换过程。 针对以上问题,我们可以通过以下步骤进行修复: **步骤一:检查URL编码处理** 确保Nutch在...

    jsp include 乱码问题的解决

    如果提供的2008712194856.chm文件是相关文档或教程,建议查阅其中的内容,获取更详细的解决方案。不过,由于无法直接查看这个文件,我们只能根据已知信息进行分析。如果你遇到具体问题,提供更多的细节将有助于找到...

    Jsp乱码问题解决

    ### JSP乱码问题解决 #### 一、JSP页面显示乱码 在JSP页面开发过程中,中文乱码是一个常见的问题。这个问题主要是由于服务器端和客户端(浏览器)的编码设置不一致导致的。 **原因分析:** 1. **服务器编码设置...

    Java中URL传中文时乱码的解决方法

    解决Java中URL传中文乱码问题的关键在于理解URL编码的规则和Java的默认编码处理。通过使用`URLEncoder.encode()`进行编码和适当的解码步骤,可以确保中文字符在URL中的正确传输。对于开发人员来说,了解这些基础知识...

    PHP采用get获取url汉字出现乱码的解决方法

    在使用PHP进行网页开发时,经常会遇到通过GET方法获取URL参数时出现乱码的问题,尤其是涉及到中文字符时。这个问题往往由于字符编码不一致导致,在本内容中,我们将详细探讨解决该问题的方法。 首先,需要了解的是...

    解决gb2312编码导致乱码问题

    标题提到的“解决gb2312编码导致乱码问题”是一个典型的字符编码问题,它涉及到如何在不同的编码格式之间正确转换,以确保中文字符在传输和显示时的正确性。gb2312是一种较老的中文字符编码标准,主要用于简体中文,...

    PHP中使用file_get_contents抓取网页中文乱码问题解决方法

    要解决file_get_contents抓取网页中文乱码的问题,可以采用以下方法: 1. 使用curl代替file_get_contents:curl是一个功能强大的命令行工具,它支持多种协议(如HTTP、HTTPS、FTP等)和多种功能(如代理支持、SSL...

    Node.js抓取中文网页乱码问题和解决方法

    在使用request库抓取网页数据时,可能会遇到乱码问题。解决这个问题的方法是在抓取到数据后,使用iconv-lite库来转换字符编码。iconv-lite是一个纯JavaScript实现的字符集转换库,它支持将Buffer转换成不同编码格式...

    java URL转PDF文件(完美支持中文)

    在Java编程环境中,将URL内容转换为PDF文件是一项常见的需求,尤其在数据抓取、文档保存或自动化报告生成等场景中。"java URL转PDF文件(完美支持中文)"的主题着重于如何利用Java库来实现这一功能,并且确保中文字符...

    url 编码 js url传参中文乱码解决方案

    在Web开发过程中,使用JavaScript在URL中传递参数时,常常会遇到中文乱码的问题。这主要是因为URL和HTTP协议都是基于...通过合适的编码和解码手段,可以有效解决JavaScript在URL中传递参数时可能出现的中文乱码问题。

    解决了中文乱码的http的get和post请求demo

    总的来说,解决HTTP请求中的中文乱码问题,核心在于正确地设置编码格式,并在发送请求前对中文数据进行编码。无论是GET还是POST请求,都需要确保客户端和服务器之间对字符编码的一致理解。通过阅读提供的文档和示例...

    解决Matlab使用urlread读取中文网页乱码问题-Matlab使用urlread()读取中文网页.doc

    在使用Matlab编程时,有时我们需要从网页抓取数据,`urlread`函数是一个非常方便的工具。然而,当处理包含中文字符的网页时,可能会遇到乱码的问题。这是因为不同网页可能采用不同的字符编码方式,如UTF-8、GBK等,...

    乱码的各种解决办法

    ### 乱码问题及其解决方案 #### 一、乱码问题概述 乱码是计算机系统中常见的一种现象,尤其是在处理多语言环境下更为突出。其主要原因是数据在存储或传输过程中所使用的字符编码与显示时所采用的字符编码不一致。...

Global site tag (gtag.js) - Google Analytics