近来用到了cvs格式,仔细研究了一下相关的文档,现将cvs格式的标准总结如下,其实还是很简单的
以下内容均来自 rfc4180
- CSV的全称是叫Comma Separated Value
-
CSV的MIME类型是text/csv
- CSV文件中的每一行数据,作为一行记录,也就是一个条目(99%的情况,排除有些换行数据,下面会提到)
-
CSV文件的每一行数据后面跟着(回车+换行符)即CRLF,但有些资料中也提到了单个CR或者LF均可,但标准rfc文档中用到的是CR+LF
- 文件第一行可以是标题行,这个用到的不多
-
每行数据中,每个字段之间均必须用半角逗号comma进行分隔,这也是为什么叫Comma Separated的来由,如果有标题行,那么标题之间也使用逗号分隔
- 每行的最后一个字段后应该只有CRLF,不应该再有逗号
- 最后一行后面可以不加CRLF
- 在逗号分隔开的每个字段中,前面的空白和后面的空白会被忽略,但单个字段内部的空白会被保留,例如, aaa, bbb bbb ,ccc 我们看到有三个字段,其中第二个字段前面,中间,后面均有空白,但CSV解析器应该只保留中间的空白,即bbb bbb,类似于java中的trim方法
-
如果某个字段中间有回车换行之类的字符,可以用双引号来引用,例如:
"aaa","b CRLF
bb","ccc" CRLF
zzz,yyy,xxx
那么可以判断出第二个字段之间内部存在一个回车换行符,由于使用双引号分隔,他们b 和 bb 被链接成一个字段
- 字段本身推荐使用双引号来引用,但MS的excel默认是不会对字段加" "的
- 转义字符逗号(,),当字段中存在逗号是,是必须要将这个字段用""引用起来的
- 转移字符双引号("),当字段中存在双引号时,必须连续用两个双引号来进行转义
分享到:
相关推荐
CSV(Comma Separated Values)格式是一种广泛使用的数据存储标准,它简单易读,且跨平台兼容性好。本资料包“各种csv格式的数据集”包含了不同行业的数据,如餐饮、电信、航空和商圈,这些都是研究和应用分析的重要...
读取CSV文件,Java标准库并没有提供直接的支持,但可以使用第三方库,如`javacsv-2.0.jar`。这是一个轻量级的库,允许开发者通过简单的API来读写CSV文件。例如,可以创建一个CSVReader对象,然后使用它逐行读取文件...
libsvm中用来进行csv格式到libsvm标准格式转换的代码,可以在自己的电脑上进行配置编译,工程在project文件夹下,可以编译成DLL用在其他程序中,也可以直接编译成exe直接在其他程序中调用
Python标准库中的`csv`模块提供了一系列工具来读取和写入CSV文件,而`pandas`库则提供了更加丰富和灵活的数据处理功能,包括数据筛选、转换、分组等操作。 最后,关于代码的版权和使用声明表明,作者允许其他人引用...
在本案例中,描述提到"csv格式是自己生成的,可用于spark",这意味着MNIST数据集被转换成了CSV(Comma-Separated Values)文件格式。CSV是一种通用的文件格式,用于存储表格数据,如电子表格或数据库。在MNIST的CSV...
ARFF格式是Weka数据挖掘工具所使用的标准格式,它以文本方式存储数据,包含两部分:描述部分和实例部分。描述部分定义了属性(特征)的名字和类型,实例部分则列出了每个样本的数据值。ARFF文件可以包含数值型、标称...
同时,处理CSV文件中的特殊字符,如逗号、引号等,以符合CSV标准。 9. **自动化转换**:对于批量转换,可以编写脚本或程序,自动处理多个XML文件。可以设置参数,如输入目录、输出目录、列映射规则等。 10. **错误...
这使得.csv文件成为跨平台和跨软件的数据交换标准。 在提供的压缩包文件列表中,有一个名为 `Setup.exe` 的文件。这通常是一个安装程序,可能是用来安装一个支持打开.csv文件的软件,比如一个特定的数据分析工具或...
VCF则是一种专门用于交换电子名片的标准格式,常用于移动设备和电子邮件客户端。它包含了联系人的姓名、电话号码、电子邮件地址等多种信息,并且大多数现代智能手机支持直接导入VCF文件来快速填充联系人列表。 要将...
CSV(Comma Separated Values)文件格式是一种广泛用于数据交换的简单文本格式。它以逗号作为字段分隔符,每一行代表一个记录,而每个记录由一个或多个字段组成。CSV文件通常用于导入和导出数据库、电子表格程序,如...
波斯顿房价数据集,标准csv格式已经修正,506条。 带表头
VCF,另一方面,是电子名片的标准格式,用于存储个人联系信息,包括姓名、电话号码、电子邮件地址、公司等。VCF文件以`.vcf`为扩展名,可以直接被许多操作系统和应用(如Android和iOS的联系人应用)识别并导入。VCF...
CSV(Comma Separated Values)是一种常见的数据存储格式,它以逗号分隔各个字段,易于阅读和编写,同时也方便程序处理。在C++中,处理CSV文件通常需要自定义函数来实现读写操作,因为C++标准库并没有内置的CSV处理...
由于其非标准的格式,直接在其他软件中打开和处理这些文件可能会遇到困难。vmsg2csv.exe工具的出现,解决了这个问题,它能解析vmsg文件,并按照预设的模板将其转换为CSV格式。 在使用vmsg2csv.exe时,用户可以...
这个数据集在CSV格式下,方便了数据科学家和学习者进行数据分析和建模。 CSV(Comma Separated Values)是一种通用的、轻量级的用于存储表格数据的文件格式,其中的每一行代表一个记录,每个字段之间用逗号分隔。在...
1. CSV文件格式:CSV是一种简单但通用的数据交换格式,它以逗号分隔各个字段,用于存储表格数据。这种格式易于处理,因为大多数编程语言都提供了读写CSV文件的库或方法。 2. CoDeSys的文件操作:CoDeSys支持对不同...
现在,MNIST数据集以CSV格式提供,相比原始的二进制格式,CSV格式在读取和处理时更直观,更适合数据分析和编程。 `mnist_train.csv`是训练数据集,包含了60,000个样本,每个样本代表一个28x28像素的手写数字图像。...
《泰坦尼克号沉船数据csv格式:探索与机器学习》 在数据分析和机器学习领域,真实世界的案例经常被用来教育和训练模型。其中,一个经典的例子就是“泰坦尼克号”沉船事件的数据集。这份csv格式的数据集提供了一个...
Qt没有内置的CSV解析器,但可以通过标准的文本流(QTextStream)或自定义实现来处理。在描述中提到的"CSVparser类"可能是项目中自定义的一个类,用于读取和解析CSV文件。通常,这个类会逐行读取文件,然后根据逗号...
`rfc4180.txt`是关于CSV文件格式的标准文档,RFC 4180是互联网工程任务组(IETF)定义的CSV格式规范。按照此标准,CSV文件应遵循一定的规则,比如字段间用逗号分隔,字段值可能用双引号括起,等等。在处理CSV数据时...