`
bewithme
  • 浏览: 430443 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

DataVec/运算

    博客分类:
  • dl4j
阅读更多

使用

运算,就像一个函数,帮我们执行一个转换并加载数据到数据向量。运算的概念是很底层的,这意味着大多数时间你不需要关心它们。

 

加载数据到Spark如果你正在使用Apache Spark,函数将迭代数据集并加载它到一个Spark RDD里并把原始数据转换为一个Writable。

 

import org.datavec.api.writable.Writable;
import org.datavec.api.records.reader.impl.csv.CSVRecordReader;
import org.datavec.spark.transform.misc.StringToWritablesFunction;

SparkConf conf = new SparkConf();
JavaSparkContext sc = new JavaSparkContext(conf)

String customerInfoPath = new ClassPathResource("CustomerInfo.csv").getFile().getPath();
JavaRDD<List<Writable>> customerInfo = sc.textFile(customerInfoPath).map(new StringToWritablesFunction(rr));

以上代码加载一个CSV文件到一个  2D java RDD。一旦你的RDD被加载,你可以转换它,执行连接并使用缩减器以任何方式处理数据。

 

可用的运算


AggregableCheckingOp 可聚合检查运算

[源码]

Created by huitseeker on 5/8/17.


AggregableMultiOp 可聚合多运算

[源码]

 

在相同的列上以并行方式来执行一些降维运算

Created by huitseeker on 5/8/17.


ByteWritableOp

[源码]

支持转换为字节码运算

Created by huitseeker on 5/14/17.


DispatchOp

[源码]

Created by huitseeker on 5/14/17.


DispatchWithConditionOp 有条件分派运算

[源码]

 

Created by huitseeker on 5/14/17.


DoubleWritableOp

[源码]

支持转换为双精度类型运算

 

Created by huitseeker on 5/14/17.


FloatWritableOp

[源码]

支持转换为浮点类型运算

 

Created by huitseeker on 5/14/17.


IntWritableOp

[源码]

支持转换为整型运算

Created by huitseeker on 5/14/17.


LongWritableOp

[源码]

支持转换为长整型运算

 

Created by huitseeker on 5/14/17.


StringWritableOp

[源码]

 

支持转换为TextWritable运算

Created by huitseeker on 5/14/17.


CalculateSortedRank

[源码]

计算每个实例在排序之后的排名。例如,我们可能有一些数字“分数”列,并且我们想知道每个实例按列的排序。每个实例的排名将会添加到一个新的长整型列。从0开始索引;实列将有0到数据大小减一的值。当前CalculateSortedRank只能应用在一个标准的(非序列)数据上。此外当前的实现只能在一个列上排序。

 

 

transform
public Schema transform(Schema inputSchema) 
  • 参数newColumnName是新列的名称(将包括每个实例的排名)
  • 参数sortOnColumn是用来排序的列名
  • 参数comparator是用来排序实例的比较器
outputColumnName
public String outputColumnName() 

运算应用后的输出列名

  • 返回输出列名
columnName
public String columnName() 

输出列名,这通常与输入列名一样。

  • 返回输出列名

有任何问题请联系微信 

如果您觉得我的文章给了您帮助,请为我买一杯饮料吧!以下是我的支付宝,意思一下我将非常感激!

     

 

 

分享到:
评论

相关推荐

    存储功能表达式计算器/运算器(Calculator)

    具有存储和语音功能的表达式计算器:(Calculator.rar升级版) ①解压后不需要安装可直接在硬盘或U盘运行Calculator.exe ②可以存储和浏览历史...②运算结果自动复制到粘贴板。 ③表达式输入具有简单的查错和纠错功能。

    大数运算(加法/减法/乘法/除法/幂运算)

    大数运算大数运算(加法/减法/乘法/除法/幂运算)

    C#计算公式源代码、可以计算四则运算(+-*/()、三解涵数等)

    可以计算出基本的四则运算(加、减、乘、除、括号)、三角涵数、自定义变量, 计算方法均封装到ConcSoft.Calculate.cs文件中,直接调用方法CalculateExpress, 如果计算式中有变量,请将交变量值存到Hashtable中。...

    复数类的实现

    实现复数类的基本数学运算(+ - * /)、赋值运算(=、+=、-=、*=、/=)、自增自减运算(++、--)、关系运算(==、!=)

    数字电路课程设计之加减法运算电路设计

    《数字电路课程设计之加减法运算电路设计》 在数字电路设计中,加减法运算电路是一项基础但至关重要的任务。本设计旨在构建一个能够处理4位并行加减法运算的电路,输入为一位十进制数,且在进行减法运算时,被减数...

    运算器组成实验报告

    【运算器组成实验报告】 运算器是计算机硬件系统中的核心组成部分,主要负责执行算术和逻辑运算。在本次实验中,我们重点研究了带有累加器的运算器的设计,包括溢出检测、有符号数与无符号数运算的差异,以及基于...

    C语言 大数运算(无限大小)头文件

    C语言大数运算(无限大小)头文件 本资源是一个C语言的大数运算头文件,支持无限大小的整数运算,包括加减乘除、余数、比较运算符等。该头文件提供了一个名为`longint`的类,重载了多种符号,支持char*、string、...

    C++程序, 设计复数类

    (1)要求利用面向对象的方法以及C++的编程思想来完成程序的设计。 (2)要求设计一个复数类。 (3)要实现复数的加、减、乘、除、输入...实现复数的混合运算表达式求值。实现复数和整数的运算。 (4)重载某些运算符。

    方程组求解器/多项式运算器

    在IT领域,尤其是在科学计算和数学建模中,方程组求解器和多项式运算器是至关重要的工具。这些工具通常被开发成软件库或独立应用程序,用于处理各种复杂问题,例如物理学、工程学、经济学等领域的模型求解。本项目名...

    计算机组成原理八位运算器的设计

    本设计的目标是创建一个具有寄存器的八位运算器模块,该模块能够执行算术运算(如加法、减法和移位运算)以及逻辑运算(如与运算、或运算),并且能够对结果进行判零和进位检测。 #### 模块设计规格及输入输出端...

    简易四则运算计算器c++代码

    大多数计算器是利用堆栈来解决的,这里使用token来作为最小元将算式不断分解后进行运算,不需要别的数据结构。

    数字图像处理图像点运算和代数运算的实现方法(matlab)

    数字图像处理图像点运算和代数运算的实现方法(matlab) 图像点运算和代数运算是数字图像处理的基本操作,它们对图像进行处理和变换,以达到图像增强、去噪、图像识别等目的。在 MATLAB 中,可以使用各种函数和命令...

    有关算术运算,变量,数组操作等的C#实例源码

    在C#编程语言中,算术运算、变量和数组操作是基础且至关重要的概念,对于任何初学者或经验丰富的开发者来说,理解并熟练掌握这些概念是编写高效代码的关键。以下是对这些主题的详细阐述: 一、算术运算 C#支持多种...

    加减法运算电路的设计方法

    在电子电路设计领域,加减法运算电路是一种基础且广泛应用的电路形式,主要用于处理输入信号的加法和减法运算。为了满足不同应用场景的需求,设计一个具有任意比例系数的加减法运算电路显得尤为重要。在此基础上,...

    C#位运算及运算符

    在C#中,位运算符有六种:位逻辑非运算、位逻辑与运算、位逻辑或运算、位逻辑异或运算、位左移运算和位右移运算。 1. 位逻辑非运算 位逻辑非运算是单目的,只有一个运算对象。位逻辑非运算按位对运算对象的值进行...

    电子功用-大规模集成电路的算术/逻辑运算部件

    本文将深入探讨大规模集成电路在算术与逻辑运算部件中的应用。 算术逻辑单元(Arithmetic Logic Unit,ALU)是计算机硬件的核心部分,负责执行基本的算术和逻辑运算。在大规模集成电路中,ALU的设计和实现至关重要...

    c++四则运算

    c++例程:c++四则运算,简单的+-*/运算

    词法分析器

    用EBNF范式设计的一个简单的程序设计语言(语言中有+、-运算,语句有赋值语句、输入语句、输出语句、复合语句)

    c语言课程设计之计算器

    用c语言设计一个简单的计算器,要求能够对输入的数(1)进行+,-,*,/,运算;(2)可以带括号();(3)不限定运算式的输入长度,(要求:1.源文件采用多文件的工程结构2.采用面向工程方法设计3.功能完善,适当的...

Global site tag (gtag.js) - Google Analytics