`
huiminchen
  • 浏览: 74810 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

编码问题导致weka不识别ARFF文件

 
阅读更多

想用weka处理一个文件,文件格式已经转为ARFF,可总是报错,如下图所示。



 警告框说not recognised as an 'Arff data files' file.

原因 Unable to determine structure as arff (keyword @relation expected)

 

可是,文件明明是ARFF格式的,文件第一行确实是@relation

 

苦思不得其解……

 

将文件中内容复制重存一份,发现弹出如下对话框。


 

该文件含有Unicode格式的字符,当文件保存为ANSI编码的文本文件时,该字符将丢失。

当时,我选择了取消,并将文件保存成Unicode编码的格式。

于是,weka就不识别ARFF文件了。

 

同时,测试了另外几种编码方式:Unicode、Unicode big endian、utf-8,均不能被weka识别。

 

  • 大小: 23 KB
  • 大小: 18.8 KB
分享到:
评论

相关推荐

    weka生成arff文件的简单代码

    通过以上步骤,我们可以使用Weka的Java API从自定义的Java对象生成ARFF文件,这在进行机器学习项目时非常有用,因为它允许我们方便地将数据转换为Weka能够识别的格式。在实际应用中,你可能还需要处理更复杂的数据...

    python 利用pandas将arff文件转csv文件的方法

    ARFF 文件是一种由 Weka 软件开发团队设计的文本文件格式,用于存储表格型数据。它由两部分组成:关系声明和属性定义。数据部分由实际数据构成,每一行代表一条记录,每个字段之间用逗号分隔。 #### 三、转换步骤...

    mat格式数据转换weka的arff格式

    matlab默认使用的数据格式是mat,而weka在数据挖掘中经常用到,但其默认格式为arff。利用本代码可以将mat格式数据自动转为arff格式,自动添加数据头信息。能够很好处理高维度数据

    weka Arff 数据集

    这个压缩包文件集合了202个ARFF(Attribute-Relation File Format)数据集,是Weka进行数据预处理、特征选择和算法训练的重要资源。ARFF格式是Weka所特有的,用于存储结构化的数据集,包括属性描述和实例数据。 **...

    WEKA入门用的银行数据集bank-data.arff

    用于weka初入门学习,银行数据包括600实例,是data-bank.arff 文件,经过csv 处理之后的可经weka使用的文件。-The learn for weka early entry, bank data including 600 instances of the the the data-bank.arff ...

    基于weka的.arff数据的低秩矩阵分解缺失值补全.java

    使用weka,jar函数读取数据arff,代码引用类型如下: import weka.core.Attribute; import weka.core.Instance; import weka.core.Instances; import weka.core.converters.ConverterUtils.DataSource; import ...

    WEKA arff 实验数据集比较全

    "WEKA arff 实验数据集比较全"这个资源集合可能包含了大量的ARFF文件,涵盖了各种数据挖掘实验所需的不同数据集。这些数据集通常源自UCI(University of California, Irvine)机器学习仓库,这是一个著名的公开数据...

    arff格式数据集D-H

    ARFF(Attribute-Relation File Format)格式是一种广泛用于数据挖掘和机器学习领域的文件格式,尤其在使用Weka这样的数据挖掘工具时。这个“arff格式数据集D-H”包含大约200个文件,这些文件可能包含了各种类型的...

    C++写Arff数据预处理

    本主题聚焦于使用C++进行Arff数据预处理,Arff文件是一种广泛用于机器学习和数据挖掘任务的文件格式,由Weka(一个开源的数据挖掘工具)支持。在C++中处理Arff数据可以提供更大的灵活性和效率。 Arff文件主要包含两...

    diabetes.arff用于weka的糖尿病预测数据集

    数据集是来源于 University of California, Irvine(UCI)机器学习数据库中的 Pima Indian Diabetes 数据集,总共包含 768 条数据项。...数据集已转arff格式(其实与csv格式差不多可自行修改),可用于weka。

    Java调用weka神经网络算法预测股票 代码及数据

    2. **加载数据**:使用Weka的`DataSource`类加载ARFF文件,将其转换为`Instances`对象,这是Weka中表示数据集的类。 3. **设置模型**:选择合适的神经网络模型,Weka提供了如MultiLayerPerceptron(多层感知器)等...

    weka.jar包,用于读取arff文件,其中instance等

    1. weka软件,机器学习的一个好软件。下载之后,可以更好学习。 2. 读取属性,属性取值,数据,更方便。 3. 与导入 jdom.jar包方法一样。

    NSL-KDD数据集arff格式

    原始KDD'99数据集中存在一些问题,如过度抽样导致的不平衡数据分布和一些不切实际的攻击模式。因此,NSL-KDD对这些问题进行了修正,去除了重复记录,调整了数据比例,使得它更适合现代网络安全研究的需求。这个数据...

    WEKA快速入门(含银行数据集bank-data及天气数据集weather)

    Weka几乎包含了所有常见机器学习算法的Java实现,Weka中支持的数据格式主要是arff,虽然weka官网上提供了一些arff文件,但有时仅有这些还不能满足需求,为此,本人搜集各方资料,再加上自己的手工转换,整理出了一个...

    arff格式数据集C

    总结来说,"arff格式数据集C"是一个由200个左右的ARFF文件组成的大型数据集,适用于数据挖掘和机器学习任务,主要与Weka工具关联。通过Weka,用户可以进行数据预处理、模型训练和评估,而文件的组织方式可能提供了一...

    arff数据集全集(new)

    识别ARFF文件的重要依据是分行,因此不能在这种文件里随意的断行。空行(或全是空格的行)将被忽略。 以“%”开始的行是注释,WEKA将忽略这些行。如果你看到的“weather.arff”文件多了或少了些“%”开始的行,是...

    arff数据集全集(weka机器学习必备)

    2dplanes.arff abalone.arff ailerons.arff Amazon_initial_50_30_10000.arff anneal.arff anneal.ORIG.arff arrhythmia.arff audiology.arff australian.arff auto93.arff autoHorse.arff autoMpg.arff ...

    arff2csv:将提供的 ARFF 文件转换为 CSV 文件并返回 CSV 文件名-matlab开发

    ARFF(Attribute-Relation File Format)是用于存储结构化数据,特别是用于机器学习和数据挖掘任务的文件格式。它由Weka数据挖掘软件引入,允许灵活地定义数据属性和类标签。ARFF文件通常包含元数据(如属性名称、...

    liac-arff:用于在Python中读写ARFF文件的库

    LIAC-ARFF liac-arff模块实现了在Python中读写ARFF文件的功能。 它是在巴西里约格兰德州联邦大学(UFRGS)的连接主义人工智能实验室(LIAC)中创建的。 ARFF(属性关系文件格式)是专门为描述数据集而创建的文件格式...

Global site tag (gtag.js) - Google Analytics