`
tangwenchao86
  • 浏览: 380263 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

在传输的过程中,统一采用utf-8编码,为了取得汉字,所以流中采用utf-8编码

阅读更多
前两天由于dns接口有变动,我帮忙测试dns解析业务:
由于在传输的过程中涉及到乱码问题,所以在传输的过程中,统一采用utf-8编码。为了能正常显示汉字,所以我们在传输过程中,流也要采用utf-8编码:

public static String getPageContent(String url, String strPostRequest) {
		String strUrl = url;
		// 读取结果网页
		StringBuffer buffer = new StringBuffer();
		System.setProperty("sun.net.client.defaultConnectTimeout", "5000");
		System.setProperty("sun.net.client.defaultReadTimeout", "5000");
		try {
			URL newUrl = new URL(strUrl);
			HttpURLConnection hConnect = (HttpURLConnection) newUrl.openConnection();
			// POST方式的额外数据
			if (strPostRequest.length() > 0) {
				hConnect.setDoOutput(true);
				hConnect.setRequestMethod("POST");
				
				OutputStreamWriter out = new OutputStreamWriter(hConnect.getOutputStream(),"utf-8");
				out.write(strPostRequest);
				out.flush();
				out.close();
			}
			// 读取内容
			BufferedReader rd = new BufferedReader(new InputStreamReader(hConnect.getInputStream(),"utf-8"));
			int ch;
			for (int length = 0; (ch = rd.read()) > -1; length++)
				buffer.append((char) ch);
			rd.close();
			hConnect.disconnect();
			return buffer.toString().trim();
		} catch (Exception e) {
			e.printStackTrace();
			return null;
		}
	}



说明:以post方法访问url,传输过程中流采用utf-8编码。
分享到:
评论

相关推荐

    UTF-8 汉字码表

    ### UTF-8编码详解与汉字码表解析 #### UTF-8编码原理 UTF-8(Unicode Transformation Format - 8 bits)是一种变长字符编码,由Ken Thompson于1992年设计,旨在解决多语言环境下字符编码兼容性问题。其核心优势...

    UTF-8toGBK_labview编码gbk_LabVIEWUTF-8_utf-8toGbk_

    用户可以通过输入UTF-8编码的字符串,然后通过这个VI得到GBK编码的结果,以便在需要GBK编码的环境中使用。 LabVIEW的"转换编码"函数通常需要指定源编码和目标编码,对于这个特定的案例,源编码应该是UTF-8,目标...

    UTF-8编码转换器

    UTF-8编码是一种广泛使用的字符编码标准,它在信息技术领域起着至关重要的作用。这个“UTF-8编码转换器”工具旨在帮助用户方便地将文本数据从其他编码格式转换为UTF-8,确保数据在不同系统和平台之间的兼容性。 在...

    汉字字符编码(utf-8 unicode gb2312)

    UTF-8编码在互联网上广泛使用,因为它能很好地兼容原有的ASCII编码系统,并且在网络传输中更节省空间。 在压缩包中的文件名称列表中,我们可以看到: - **UTF-8中文字符表.txt**:这个文件可能包含了使用UTF-8编码...

    UTF-8 编码转换工具

    UTF-8编码是一种广泛使用的字符编码标准,尤其在网络和计算机系统中扮演着核心角色。它能够表示Unicode字符集中的所有字符,包括世界各地的各种语言。UTF-8的优势在于其兼容性和效率,不同平台和语言通常都能无缝...

    gb2312,utf-8,utf-8-bom等编码格式的互相转换

    UTF-8-BOM,全称是“UTF-8 Byte Order Mark”,它在UTF-8编码的文件开头添加了一个特殊的字节序列(0xEF, 0xBB, 0xBF)来标识该文件使用的是UTF-8编码。BOM主要用于帮助软件识别文件的编码,但并非所有UTF-8编码的...

    UTF-8 Unicode GBK GB2312 编码之间的区别和联系

    - 对于含有大量英文字符的网站或论坛,建议使用UTF-8编码,因为它更节省空间且具有更好的国际通用性。 - 对于需要支持GBK编码的插件或软件,在没有UTF-8支持的情况下,可能需要使用GBK编码。 #### 八、总结 UTF-8...

    GBK编码转换和UTF-8编码转换模块源码

    3. 对于UTF-8编码的字符串,由于UTF-8本身就是变长编码,每个Unicode字符可能对应1到4个字节,所以转换时需要逐字节处理,并根据字节流判断对应的Unicode字符,然后进行URL编码。 4. 返回URL编码后的字符串。 在...

    日历脚本—utf-8编码

    这意味着UTF-8编码的文本文件在国际化的环境中具有更好的兼容性和可读性。 将日历脚本从GBK或GB2312转换为UTF-8,可以带来以下好处: 1. **国际化支持**:UTF-8能支持多种语言,这对于需要处理多语言环境的日历...

    java 中文字符串,utf-8编码为byte数组的计算过程

    本文将深入探讨如何将中文字符串转换成UTF-8编码的字节数组,并解析这一过程中的计算步骤。UTF-8是一种广泛使用的Unicode字符编码,它可以表示Unicode字符集中的所有字符。 首先,我们需要明白Unicode字符集是一个...

    UTF-8编码转BIG5、gb2312

    例如,一个使用UTF-8编码的网站可能需要与使用GB2312编码的数据库交互,或者一个BIG5编码的文本文件需要在UTF-8环境下打开。不正确的编码可能导致乱码问题,使得文本无法正确读取。 编码转换的方法有很多,包括使用...

    js gb2312和utf-8互转

    根据提供的文件信息,本文将详细解释如何在JavaScript中实现GB2312编码与UTF-8编码之间的相互转换。此技术对于处理不同编码格式的文本数据尤为重要,尤其是在Web开发领域中,经常需要处理多种字符集的数据。 ### GB...

    GB2312转UTF-8(C代码)

    UTF-8的一个显著特点是兼容ASCII编码,对于ASCII字符,UTF-8编码与ASCII编码完全相同,仅用一个字节表示。对于非ASCII字符,UTF-8使用1到4个字节来表示,这样设计使得在多数英文为主的系统中,可以有效利用存储空间...

    utf-8 中文字符表

    在网络通信中,数据通常以字节流的形式传输,因此正确解析UTF-8编码的字符至关重要,避免因编码问题导致的信息丢失或误解。 总的来说,UTF-8中文字符表是一个非常实用的工具,它对于跨平台的Web开发和系统间的文本...

    GB/BIG5/UTF-8 文件编码批量转换程序

    "GB/BIG5/UTF-8 文件编码批量转换程序"就是解决这个问题的工具,它可以将GB2312(GBK)、BIG5编码的文件批量转换为UTF-8编码,确保在各种环境中正确显示文本。 3. **批量转换** 批量转换功能使得用户无需逐个文件...

    java 编码 UTF-8、ISO-8859-1、GBK

    3. **数据库中的数据编码**:存储中文数据的数据库表和字段也需要使用兼容中文的编码,如GBK或UTF-8。 4. **Java默认编码**:Java虚拟机(JVM)的默认编码可能会影响文件读写和字符串处理。可以通过 `-Dfile....

    utf-8文件非常好用

    为了解决日益复杂的交流需求,人们需要一种能够通用于各种语言与符号的编码方式,而UTF-8编码便是在这种背景下脱颖而出的解决方案。UTF-8编码不仅改变了信息存储与传输的方式,还极大地推动了全球信息化进程的发展。...

    汉字Ucode,GBK,UTF-8编码表(真实可用的三种编码!)

    - “b0a1”在GBK编码中的汉字,在Unicode编码中为“00b1”,对应的UTF-8编码为“c2-b1”。 #### 六、应用场景 - **GBK编码**主要在中国大陆地区使用,特别是在早期的中文操作系统和软件开发中。随着国际化的推进...

    JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换

    - **Unicode到UTF-8**: 同样以"a 中文"为例,转换为UTF-8编码后,字节数组为`0x61 0xE4 0xB8 0xAD 0xE6 0x96 0x87`。 - **UTF-8到Unicode**: 反向转换后,结果依然是"a 中文"。 ##### 3. Unicode与ISO-8859-1 - **...

Global site tag (gtag.js) - Google Analytics