`
san_yun
  • 浏览: 2693775 次
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

Hadoop-SequenceFile code

 
阅读更多

写的例子:

package mytest.mapreduce;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.SequenceFile;
import org.apache.hadoop.io.Text;

public class MySequenceTester {

	private static final String data[] = {
			"One, two, buckle my shoe",
			"Three, four, shut the door",
			"Five, six, pick up sticks",
			"Seven, eight, lay them straight",
			"Nine, ten, a big fat hen"
	};

	public static void main(String[] args) throws IOException {
		Configuration conf = new Configuration();
		FileSystem fs = FileSystem.get(conf);
		Path path = new Path("/duitang/data/test/client-request.log.seq");

		IntWritable key = new IntWritable();
		Text value = new Text();

		SequenceFile.Writer writer = SequenceFile.createWriter(fs, conf, path, key.getClass(), value.getClass());
		try {

			for (int i = 0; i < 100; i++) {
				key.set(100 - i);
				value.set(data[i % data.length]);
				System.out.printf("[%s]\t%s\t%s\n", writer.getLength(), key, value);
				writer.append(key, value);
			}

		} finally {
			IOUtils.closeStream(writer);
		}
	}
}

 

分享到:
评论

相关推荐

    glibc-2.14 Hadoop专属glib

    升级glib解决Hadoop WARN util.NativeCodeLoader: ... 和 SequenceFile doesn't work with GzipCodec without native-hadoop code 问题, 具体请参见博文:https://blog.csdn.net/l1028386804/article/details/88420473

    sequencefile&mapfile代码

    在Hadoop生态系统中,SequenceFile和MapFile是两种常见的数据存储格式,它们为大数据处理提供了高效、可扩展的解决方案。这两个文件格式都是Hadoop原生支持的,用于存储大规模数据集,尤其适用于分布式环境。接下来...

    TextFile转为SequenceFile

    业务需要hive读取SequenceFile文件,所以把TextFile类型转SequenceFile,再导入hive

    sqoop详细教程

    codegen Generate code to interact with database records create-hive-table Import a table definition into Hive eval Evaluate a SQL statement and display the results export Export an HDFS directory ...

    hadoop_the_definitive_guide_3nd_edition

    SequenceFile 132 MapFile 139 5. Developing a MapReduce Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 The Configuration API 146 Combining Resources 147 ...

    04-大数据技术之高频面试题9.0.5.pdf

    - **错误处理**:通过exit code判断命令执行结果,进行错误处理。 #### 1.1.3 Shell 中单引号和双引号区别 - **单引号('')**:其中的内容被视为字符串字面量,不会进行变量替换或命令替换。 - **双引号("")**:允许...

    sqoop1-1.4.6 documentation 英文文档

    - **7.2.10 文件格式**:支持多种输出文件格式,包括 TextFile、SequenceFile、AvroDataFile 等。 - **7.2.11 大对象**:处理 Blob 和 Clob 数据类型。 - **7.2.12 导入数据到 Hive**:通过 `--create-hive-table` ...

    sequencefiles:支持关于从序列文件加载数据的博客文章的代码

    关于该存储库包含一个简单的项目,用于演示将 ... 首先,将序列文件加载到 HDFS: hadoop fs -copyFromLocal zips.sequence接下来,从zips-1.jar的 ZipCode 类构建一个架构: kite-dataset obj-schema org.kitesd

    DGAtestingall

    - 在大数据领域,Hadoop和Spark等框架也提供了数据生成功能,例如Hadoop的SequenceFile和Avro可以用于生成大规模数据文件。 2. **单元测试(Unit Testing)**: - JUnit是Java中最常用的单元测试框架,它允许...

Global site tag (gtag.js) - Google Analytics