java download csv (utf-8)文件用excell打开乱码的问题,我在网上搜了很久,一直没有找到解决方案,曾经在javaeye 上看到过一篇文章关于加上BOM标记的文章
http://yvonxiao.iteye.com/blog/564461 试验下来根本不解决问题。
首先来看一下问题:
我的测试环境使用的是excell 2003 经过测试 阅读csv文件根本不认识UTF-8编码,测试过程是这样的:
【1】excell编辑保存一份csv文件
【2】用notepad开打,可以看到他的是ANSI编码格式保存的.
【3】用IE打开可以看到他的编码是GB2312.
以上说明至少在我的xp的机器上excell能认出GB2312编码方式存放的csv文件。
【4】用notepad把这份文件另存为UTF-8格式(注意windows自带的notepad存为utf-8是带有bom),然后用excell打开,结果是乱码
以上说明至少在我的机器上excell不认识UTF-8带BOM的csv文件
【5】用notepad++去掉bom标示保存后 excell打开依然是乱码
以上说明至少在我的机器上excell不认识UTF-8不带BOM的csv文件
那么如果才能保存让excell2003认识的csv文件呢,最简单的方式就是保存和步骤【3】一样的文件格式!
【1】在c://temp 目录下建立utf-8编码的文件:
我爱,中国
【2】运行如下程序
public static void main(String[] args) throws IOException {
Properties properties = System.getProperties();;
System.out.println(properties.getProperty("file.encoding"));
String in =FileUtils.readFileToString(new File("C:\\temp\\test.txt"), "UTF-8");
byte[] aa=in.getBytes();
byte[] bb ;
//EF BB BF
if (Bytes2HexString(aa,0,2).equals("EFBBBF")){
System.out.println("BOM");
bb=Arrays.copyOfRange(aa, 3, aa.length);
}else{
bb=aa;
}
//FileUtils.writeByteArrayToFile(new File("C:\\temp\\test2312.txt"), new String (bb,"GB2312");)
FileUtils.writeStringToFile(new File("C:\\temp\\test2312.csv"), new String (bb,"UTF-8"),"GB2312");
}
public static String Bytes2HexString(byte[] b,int start ,int end) {
String ret = "";
if (end >=b.length) end=b.length;
for (int i = start; i <= end; i++) {
String hex = Integer.toHexString(b[i] & 0xFF);
if (hex.length() == 1) {
hex = '0' + hex;
}
ret += hex.toUpperCase();
}
return ret;
}
最后用excell开打test2312文件 一切正常。
分析:
无论是用struts还是数据库取出的数据,首先要了解数据来源的编码,这个例子数据来源的编码是utf-8格式的。
最后写文件文件的时候excell认csv文件的时候之人ansi编码的,中文可以用GB2312,日文和韩文的话你要自己查一下别人机器上支持的编码。
附上一篇讲解编码的非常好的好文章:
http://www.regexlab.com/zh/encoding.htm
分享到:
相关推荐
minist数据集的csv格式 网上的其他资源均为gz等格式,所以找了一份csv格式的数据上传分享给大家
标题 "sitka_weather_07-2014.csv" 提供的是一个特定的CSV文件名,这通常意味着它是一个包含结构化数据的文件,很可能用于数据分析或统计用途。CSV(Comma Separated Values)是一种常见的文件格式,用于存储表格...
Python数据科学配套的操作数据,可以用数据...文件名为accepts.csv,主要是做逻辑回归分析时使用,也可用于决策树分类。数据大小和格式与书上的有点不同,需要自己重新梳理,不过网上有完整版的操作过程,请自行前往。
历年美国消费者信心指数
泰坦尼克号2201人员的csv数据集。 主要特征有:PassengerId、Pclass、Name 、Sex、Age 、SibSp、 Parch、Ticket 、Fare 、Cabin 、Embarked
Social_Network_Ads.csv,一个数据集内含400条数据,欢迎下载,欢迎下载,欢迎下载。
csv下载 一个简单的Web组件,用于将数组(或类似数组的对象)数组下载为CSV文件。 它扩展了元素。 演示版 安装 使用安装组件: $ bower install csv-... a is =" csv-download " data =" {{someArray}} " download =
在该数据集中,ECG信号已被处理为CSV格式,这是数据科学中常见的数据存储方式,便于用各种编程语言如Python的Pandas库进行读取和分析。 描述中提到的"kaggle竞赛数据"表明这是一个数据科学竞赛的数据集,可能要求...
R语言记号体系所用的数据。
鸢尾花数据集 约150条数据,每条样本4个属性,共3个类别
link.download = 'output.csv'; link.click(); setTimeout(() => URL.revokeObjectURL(url), 0); // 释放URL引用 ``` 在Node.js环境中,你可以使用`fs`模块将CSV字符串写入文件: ```javascript const fs = ...
骑自行车的女孩,flash源文件。
在IT领域,数据处理是日常工作中不可或缺的一部分,而CSV(Comma Separated Values)和XLS(Excel)格式则是常见的数据存储方式。CSV文件因其简洁、通用性而被广泛使用,而XLS文件则提供了更丰富的格式化和计算功能...
该程序为可执行文件,功能是将某个目录下的xls或xlsx文件全部转化为csv文件,源码为:http://download.csdn.net/download/zonelza3/4144850,但由于这位朋友的源码会与WIN的SDK重定义Font类,所以导致编译不过,我修改了...
在IT行业中,CSV(Comma Separated Values)文件是一种广泛使用的数据存储格式,因其简单、通用而备受青睐。本文将详细讲解如何使用C# .NET进行CSV文件的操作,包括读取和写入。 首先,我们要了解CSV文件的基本结构...
目标检测中CSV格式转XML格式
在这个特定的项目"scheduled-download-csv-master_SpringBoot_读取文件_sftp_"中,我们看到一个利用Spring Boot实现的功能,即定时从Linux服务器通过SFTP(Secure File Transfer Protocol)协议下载.csv文件,然后...
机器学习小案例csv文件,网上得搜半天,我复制粘贴自己建了个,有需求拿 资源原出处:https://github.com/Anfany/Machine-Learning-for-Beginner-by-Python3/blob/master/Linear%20Regression/Boston.csv
`mnist_train_100.csv`可能是只包含100个样本的子集,用于快速验证模型,而`mnist_test_10.csv`可能是10个样本的测试子集,用于快速测试模型性能。 原始的二进制文件如`train-images-idx3-ubyte.gz`和`t10k-images-...