IO 流读取文件时候出现乱码文件编码格式问题怎么转换解决方法

yzz9i

浏览: 222442 次
性别:
来自: 湖南

最近访客更多访客>>

weswe154

xueshanfeizhu

等到音信断绝

jadechenfei

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

SSH技术

文件读取出现乱码乱码解决方法

在使用下面这个写法时候UTF-8文件编码在读取时候出现乱码问题。
File myFile=new File("文件路径");

 BufferedReader in = new BufferedReader(new FileReader(myFile));

应该修改为：

 BufferedReader in = new BufferedReader(new InputStreamReader(
					new FileInputStream(myFile), "UTF-8"));

如果使用INSA编码时候请使用下面文件读取方式：

InputStreamReader reader = new InputStreamReader(
						new FileInputStream(new File("文件路径")), "gb2312");

下面是我对文件编码的判断方法：

/**
	 * 上传文件编码判断
	 * */
	public static String get_charset(File file) {
		String charset = "GBK";
		byte[] first3Bytes = new byte[3];
		try {
			boolean checked = false;
			;
			BufferedInputStream bis = new BufferedInputStream(
					new FileInputStream(file));
			bis.mark(0);
			int read = bis.read(first3Bytes, 0, 3);
			if (read == -1)
				return charset;
			if (first3Bytes[0] == (byte) 0xFF && first3Bytes[1] == (byte) 0xFE) {
				charset = "UTF-16LE";
				checked = true;
			} else if (first3Bytes[0] == (byte) 0xFE
					&& first3Bytes[1] == (byte) 0xFF) {
				charset = "UTF-16BE";
				checked = true;
			} else if (first3Bytes[0] == (byte) 0xEF
					&& first3Bytes[1] == (byte) 0xBB
					&& first3Bytes[2] == (byte) 0xBF) {
				charset = "UTF-8";
				checked = true;
			}
			bis.reset();
			if (!checked) {
				// int len = 0;
				int loc = 0;

				while ((read = bis.read()) != -1) {
					loc++;
					if (read >= 0xF0)
						break;
					if (0x80 <= read && read <= 0xBF) // 单独出现BF以下的，也算是GBK
						break;
					if (0xC0 <= read && read <= 0xDF) {
						read = bis.read();
						if (0x80 <= read && read <= 0xBF) // 双字节 (0xC0 - 0xDF)
							// (0x80
							// - 0xBF),也可能在GB编码内
							continue;
						else
							break;
					} else if (0xE0 <= read && read <= 0xEF) {// 也有可能出错，但是几率较小
						read = bis.read();
						if (0x80 <= read && read <= 0xBF) {
							read = bis.read();
							if (0x80 <= read && read <= 0xBF) {
								charset = "UTF-8";
								break;
							} else
								break;
						} else
							break;
					}
				}

			}

			bis.close();
		} catch (Exception e) {
			e.printStackTrace();
		}

		return charset;
	}

调用时候判断编码方式UTF-8 或是 INSA编码：

BufferedReader br = null;
			if (charset == "GBK") {
				InputStreamReader reader = new InputStreamReader(
						new FileInputStream(new File(filepath)), "gb2312");
				br = new BufferedReader(reader);
			}
			if (charset == "UTF-8") {
				br = new BufferedReader(new InputStreamReader(
						new FileInputStream(filepath), "UTF-8"));
			}

1
顶

0
踩

分享到：

Invalid byte 2 of 2-byte UTF-8 sequence. ... | 很强大的jsp手写分页插件实现json 等一 ...

2011-11-08 12:18
浏览 4518
评论(0)
分类:Web前端
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

IO 流读取文件时候出现乱码文件编码格式问题怎么转换解决方法

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

IO 流读取文件时候出现乱码 文件编码格式问题 怎么转换解决方法

评论

发表评论

相关推荐

Java在项目中怎么让系统运行的更快，其实有好多方法 下面主要写到怎么运用系统级缓存

(JAVA)未登录获取系统数据，例如一些公告之类的展示数据

Java 中怎么发送 Email 邮件

Java 中实现定时服务 在ssh框架中跟普通工程里面创建的方式，区别

Java 方便调用的工具类

Java 里面怎么发送XML数据请求 和怎么处理返回的XML数据

创建系统参数 (实例化参数)

Exception in thread "main"：com/sun/mail/util/LineInputStream

很强大的jsp手写分页插件 实现json 等一些ajax技术 联合查询 模糊查询 条件查询

Java 动态加载jsp页面 在div 刷新这么简单 就可以实现了

注释方式 类生成数据库表

c:foreach 中jsp页面 中怎么对时间类型进行格式化问题

给配置了c3p0的application.xml 配置一个单独的连接文件 applicationContext.xml 数据库连接就不要老是该来改去了

dao 分页方法

ssh 整合 中怎么使用 c3p0 链接池 经测试已成功 不受 hibernate的8小时限制

怎么控制 显示 DIV 里面的 字数 只显示部分文字

FCKeditor 在jsp [ssh 框架中]中怎么调用 实现 图片上传/文件浏览【自己看文档摸索出来的】跟大家一块分享

使用 过滤器 filter处理session超时问题

最好用 最简单的日期时间javascript代码

InputStreamReader 与 BufferedReader 文件读取时候区别

最近访客更多访客>>

IO 流读取文件时候出现乱码文件编码格式问题怎么转换解决方法

Java在项目中怎么让系统运行的更快，其实有好多方法下面主要写到怎么运用系统级缓存

Java 中实现定时服务在ssh框架中跟普通工程里面创建的方式，区别

Java 里面怎么发送XML数据请求和怎么处理返回的XML数据

很强大的jsp手写分页插件实现json 等一些ajax技术联合查询模糊查询条件查询

Java 动态加载jsp页面在div 刷新这么简单就可以实现了

注释方式类生成数据库表

c:foreach 中jsp页面中怎么对时间类型进行格式化问题

ssh 整合中怎么使用 c3p0 链接池经测试已成功不受 hibernate的8小时限制

怎么控制显示 DIV 里面的字数只显示部分文字

FCKeditor 在jsp [ssh 框架中]中怎么调用实现图片上传/文件浏览【自己看文档摸索出来的】跟大家一块分享

使用过滤器 filter处理session超时问题

最好用最简单的日期时间javascript代码