文章列表
Pig Latin关系操作
类型 操作 描述
加载与存储 LOAD 将数据从文件系统或其他存储中加载数据,存入关系
STORE 将一个关系存放到文件系统或其他存储中
DUMP 从关系打印到控制台
过滤 FILTER 从关系中删除不需要的行
DISTINCT 在关系中删除删除重复的行
FOREACH…GENERATE 在关系中增加或删除字段
STREAM 使用外部程序对关系进行变换
SAMPLE 从关系中随机取样
分组与连接 JOIN 连接两个或者多个关系
COGROUP 在两个或者更多关系中对数据进行分组
GROUP 在一个关系中对数据进行分组
CRO ...
JobBuilder.java
- 博客分类:
- hadoop
package common;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import org.apache.hadoop.mapred.*;
import org.apache.hadoop.util.GenericOptionsParser;
import org.apache.hadoop.util.Tool;
public class JobBuilder {
private final ...