[hadoop2.7.1]I/O之序列化（WritableSerialization）示例

tenght

浏览: 52628 次

最近访客更多访客>>

jxqc_job

汽车城路

极品拖拉机

aubdiy

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

首先先引入hadoop2.7.1中的一个工具类GenericsUtil，顾名思义，是用来处理java泛型的一个工具类，这个类很简单，但很实用，不多说，直接上源码：

package org.apache.hadoop.util;

import java.lang.reflect.Array;
import java.util.List;

import org.apache.hadoop.classification.InterfaceAudience;
import org.apache.hadoop.classification.InterfaceStability;

/**
 * Contains utility methods for dealing with Java Generics. 
 */
@InterfaceAudience.Private
@InterfaceStability.Unstable
public class GenericsUtil {

  /**
   * Returns the Class object (of type <code>Class<T></code>) of the  
   * argument of type <code>T</code>. 
   * @param <T> The type of the argument
   * @param t the object to get it class
   * @return <code>Class<T></code>
   */
  public static <T> Class<T> getClass(T t) {
    @SuppressWarnings("unchecked")
    Class<T> clazz = (Class<T>)t.getClass();
    return clazz;
  }

  /**
   * Converts the given <code>List<T></code> to a an array of 
   * <code>T[]</code>.
   * @param c the Class object of the items in the list
   * @param list the list to convert
   */
  public static <T> T[] toArray(Class<T> c, List<T> list)
  {
    @SuppressWarnings("unchecked")
    T[] ta= (T[])Array.newInstance(c, list.size());

    for (int i= 0; i<list.size(); i++)
      ta[i]= list.get(i);
    return ta;
  }

  /**
   * Converts the given <code>List<T></code> to a an array of 
   * <code>T[]</code>. 
   * @param list the list to convert
   * @throws ArrayIndexOutOfBoundsException if the list is empty. 
   * Use {@link #toArray(Class, List)} if the list may be empty.
   */
  public static <T> T[] toArray(List<T> list) {
    return toArray(getClass(list.get(0)), list);
  }

}

利用上面的工具类，下面举一个TestWritableSerialization的一个示例，源码如下：

import java.io.Serializable;
import java.util.EnumSet;

import org.apache.hadoop.io.DataInputBuffer;
import org.apache.hadoop.io.DataOutputBuffer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.io.ArrayWritable;
import org.apache.hadoop.io.EnumSetWritable;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.BytesWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.Writable;
import org.apache.hadoop.io.WritableComparator;
import org.apache.hadoop.util.GenericsUtil;

import org.junit.Test;
import static org.junit.Assert.*;

public class THT_TestWritableSerialization {

	private static final Configuration conf = new Configuration();

	enum TestEnumSet {
		CREATE, OVERWRITE, APPEND;
	}

	@Test
	public void testWritableSerialization() throws Exception {
		IntWritable before1 = new IntWritable(123456789);
		byte[] hadoop = "hadoop".getBytes();
		BytesWritable before2 = new BytesWritable(hadoop);
		String[] arraywr = { "zero", "one", "two" };
		ArrayWritable arraywrA = new ArrayWritable(arraywr);
		Writable[] arraywrW = arraywrA.get();
		Writable before3 = arraywrW[0];
		EnumSetWritable<TestEnumSet> before4 = new EnumSetWritable<TestEnumSet>(
				EnumSet.of(TestEnumSet.APPEND));
		Text before5=new Text("test for you");

		IntWritable after1 = testSerialization(conf, before1);
		BytesWritable after2 = testSerialization(conf, before2);
		Writable after3 = testSerialization(conf, before3);
		EnumSetWritable<TestEnumSet> after4 = testSerialization(conf, before4);
		Text after5 = testSerialization(conf, before5);
		
		assertEquals(before1, after1);
		assertEquals(before2, after2);
		assertEquals(before3, after3);
		assertEquals(before4, after4);
		assertEquals(before5, after5);
	}

	public static <K> K testSerialization(Configuration conf, K before)
			throws Exception {

		SerializationFactory factory = new SerializationFactory(conf);
		Serializer<K> serializer = factory.getSerializer(GenericsUtil
				.getClass(before));
		Deserializer<K> deserializer = factory.getDeserializer(GenericsUtil
				.getClass(before));

		DataOutputBuffer out = new DataOutputBuffer();
		serializer.open(out);
		serializer.serialize(before);
		serializer.close();

		DataInputBuffer in = new DataInputBuffer();
		in.reset(out.getData(), out.getLength());
		deserializer.open(in);
		K after = deserializer.deserialize(null);
		deserializer.close();
		return after;
	}
}

分享到：

[hadoop2.7.2]搭建eclipse源码阅读环境 | [hadoop2.7.1]I/O之序列化（serializer）

2015-12-11 15:38
浏览 477
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop权威指南第二版(中文版): Hadoop的I/O、MapReduce应用程序开发；MapReduce的工作机制；MapReduce的类型和格式；MapReduce的特性；如何构建Hadoop集群，如何管理Hadoop；Pig简介；Hbase简介；Hive简介；ZooKeeper简介；开源工具Sqoop，最后还...

Hadoop权威指南（中文版）2015上传.rar: 第4章 Hadoop I/O 数据完整性 HDFS的数据完整性 LocalFileSystem ChecksumFileSystem 压缩 codec 压缩和输入切分在MapReduce中使用压缩序列化 Writable接口 Writable类实现定制的Writable类型序列化框架 Avro ...

AI从头到脚详解如何创建部署Azure Web App的OpenAI项目源码: 【AI】从头到脚详解如何创建部署Azure Web App的OpenAI项目源码

人脸识别_卷积神经网络_CNN_ORL数据库_身份验证_1741779511.zip: 人脸识别项目实战

人工智能-人脸识别代码: 人工智能-人脸识别代码，采用cnn的架构识别代码

汽车配件制造业企业信息化整体解决方案.pptx: 汽车配件制造业企业信息化整体解决方案

短期风速预测模型，IDBO-BiTCN-BiGRU-Multihead-Attention IDBO是，网上复现评价指标：R方、MAE、MAPE、RMSE 附带测试数据集运行（风速数据）提示：在: 短期风速预测模型，IDBO-BiTCN-BiGRU-Multihead-Attention IDBO是，网上复现评价指标：R方、MAE、MAPE、RMSE 附带测试数据集运行（风速数据）提示：在MATLAB2024a上测试正常 ,短期风速预测模型; IDBO-BiTCN-BiGRU-Multihead-Attention; 评价指标: R方、MAE、MAPE、RMSE; 复现; 测试数据集; MATLAB 2024a,短期风速预测模型：IDBO-BiTCN-BiGRU-Attention集成模型

手势识别_数据融合_运动融合帧_Pytorch实现_1741857761.zip: 手势识别项目实战

智慧园区IBMS可视化管理系统建设方案PPT(61页).pptx: 在智慧园区建设的浪潮中，一个集高效、安全、便捷于一体的综合解决方案正逐步成为现代园区管理的标配。这一方案旨在解决传统园区面临的智能化水平低、信息孤岛、管理手段落后等痛点，通过信息化平台与智能硬件的深度融合，为园区带来前所未有的变革。首先，智慧园区综合解决方案以提升园区整体智能化水平为核心，打破了信息孤岛现象。通过构建统一的智能运营中心（IOC），采用1+N模式，即一个智能运营中心集成多个应用系统，实现了园区内各系统的互联互通与数据共享。IOC运营中心如同园区的“智慧大脑”，利用大数据可视化技术，将园区安防、机电设备运行、车辆通行、人员流动、能源能耗等关键信息实时呈现在拼接巨屏上，管理者可直观掌握园区运行状态，实现科学决策。这种“万物互联”的能力不仅消除了系统间的壁垒，还大幅提升了管理效率，让园区管理更加精细化、智能化。更令人兴奋的是，该方案融入了诸多前沿科技，让智慧园区充满了未来感。例如，利用AI视频分析技术，智慧园区实现了对人脸、车辆、行为的智能识别与追踪，不仅极大提升了安防水平，还能为园区提供精准的人流分析、车辆管理等增值服务。同时，无人机巡查、巡逻机器人等智能设备的加入，让园区安全无死角，管理更轻松。特别是巡逻机器人，不仅能进行360度地面全天候巡检，还能自主绕障、充电，甚至具备火灾预警、空气质量检测等环境感知能力，成为了园区管理的得力助手。此外，通过构建高精度数字孪生系统，将园区现实场景与数字世界完美融合，管理者可借助VR/AR技术进行远程巡检、设备维护等操作，仿佛置身于一个虚拟与现实交织的智慧世界。最值得关注的是，智慧园区综合解决方案还带来了显著的经济与社会效益。通过优化园区管理流程，实现降本增效。例如，智能库存管理、及时响应采购需求等举措，大幅减少了库存积压与浪费；而设备自动化与远程监控则降低了维修与人力成本。同时，借助大数据分析技术，园区可精准把握产业趋势，优化招商策略，提高入驻企业满意度与营收水平。此外，智慧园区的低碳节能设计，通过能源分析与精细化管理，实现了能耗的显著降低，为园区可持续发展奠定了坚实基础。总之，这一综合解决方案不仅让园区管理变得更加智慧、高效，更为入驻企业与员工带来了更加舒适、便捷的工作与生活环境，是未来园区建设的必然趋势。

相亲交友系统源码 V10.5支持婚恋相亲M红娘系统.zip: 相亲交友系统源码 V10.5支持婚恋相亲、媒婆返利、红娘系统、商城系统等等这款交友系统功能太多了，适合婚恋相亲，还有媒婆婚庆等等支持 PC和 H5还有小程序，可封装红年、APP，里面带安装教程

单片机也能玩双核之你想不到c技巧系列-嵌入式实战（资料+视频教程）: 本资源《单片机也能玩双核之你想不到的C技巧系列——嵌入式实战》涵盖双核单片机开发、C语言高级技巧、嵌入式系统优化等核心内容，结合实战案例与视频教程，帮助开发者深入理解并掌握高效编程技巧。适用人群：适合嵌入式开发工程师、单片机开发者、电子信息相关专业学生，以及希望提升 C语言编程能力和嵌入式项目经验的技术人员。能学到什么：双核单片机开发思路，提高并行处理能力。 C语言高级技巧，提升代码优化与执行效率。嵌入式系统调试方法，掌握实际项目中的调试策略。实战案例解析，学习如何在实际工程中应用双核技术。阅读建议：建议先学习基础知识，再结合示例代码与视频教程进行实操，重点关注代码优化、调试技巧与双核应用模式，通过实战演练提高嵌入式开发能力。

计算机视觉_OpenCV_人脸识别_成本节约检测方案_1741779495.zip: 人脸识别项目源码实战

`机器学习_深度学习_Keras_教程用途`.zip: 人脸识别项目源码实战

地铁网络_Dijkstra_最短路径_查询工具_1741862725.zip: c语言学习

红外光伏缺陷目标检测模型，YOLOv8模型基于红外光伏缺陷目标检测数据集训练，做了必要的数据增强处理，以达到缺陷类别间的平衡可检测大面积热斑，单一热斑，二极管短路和异常低温四类缺陷测试集指标如: 红外光伏缺陷目标检测模型，YOLOv8模型基于红外光伏缺陷目标检测数据集训练，做了必要的数据增强处理，以达到缺陷类别间的平衡可检测大面积热斑，单一热斑，二极管短路和异常低温四类缺陷测试集指标如图所示 ,核心关键词：红外光伏缺陷目标检测模型; YOLOv8模型; 数据增强处理; 缺陷类别平衡; 大面积热斑; 单一热斑; 二极管短路; 异常低温。,基于YOLOv8的红外光伏缺陷检测模型

基于PLC的自动浇花控制系统西门子1200PLC博途仿真，提供HMI画面，接线图，IO分配表，演示视频，简单讲解视频博图15.1及以上版本均可使用 ,核心关键词： PLC自动浇花控制系统; 西: 基于PLC的自动浇花控制系统西门子1200PLC博途仿真，提供HMI画面，接线图，IO分配表，演示视频，简单讲解视频博图15.1及以上版本均可使用 ,核心关键词： PLC自动浇花控制系统; 西门子1200PLC博途仿真; HMI画面; 接线图; IO分配表; 演示视频; 简单讲解视频; 博图15.1及以上版本。,基于PLC的自动浇花系统：西门子1200PLC博途仿真实践教程

智慧园区标准化综合解决方案PPT(60页).pptx: 在智慧园区建设的浪潮中，一个集高效、安全、便捷于一体的综合解决方案正逐步成为现代园区管理的标配。这一方案旨在解决传统园区面临的智能化水平低、信息孤岛、管理手段落后等痛点，通过信息化平台与智能硬件的深度融合，为园区带来前所未有的变革。首先，智慧园区综合解决方案以提升园区整体智能化水平为核心，打破了信息孤岛现象。通过构建统一的智能运营中心（IOC），采用1+N模式，即一个智能运营中心集成多个应用系统，实现了园区内各系统的互联互通与数据共享。IOC运营中心如同园区的“智慧大脑”，利用大数据可视化技术，将园区安防、机电设备运行、车辆通行、人员流动、能源能耗等关键信息实时呈现在拼接巨屏上，管理者可直观掌握园区运行状态，实现科学决策。这种“万物互联”的能力不仅消除了系统间的壁垒，还大幅提升了管理效率，让园区管理更加精细化、智能化。更令人兴奋的是，该方案融入了诸多前沿科技，让智慧园区充满了未来感。例如，利用AI视频分析技术，智慧园区实现了对人脸、车辆、行为的智能识别与追踪，不仅极大提升了安防水平，还能为园区提供精准的人流分析、车辆管理等增值服务。同时，无人机巡查、巡逻机器人等智能设备的加入，让园区安全无死角，管理更轻松。特别是巡逻机器人，不仅能进行360度地面全天候巡检，还能自主绕障、充电，甚至具备火灾预警、空气质量检测等环境感知能力，成为了园区管理的得力助手。此外，通过构建高精度数字孪生系统，将园区现实场景与数字世界完美融合，管理者可借助VR/AR技术进行远程巡检、设备维护等操作，仿佛置身于一个虚拟与现实交织的智慧世界。最值得关注的是，智慧园区综合解决方案还带来了显著的经济与社会效益。通过优化园区管理流程，实现降本增效。例如，智能库存管理、及时响应采购需求等举措，大幅减少了库存积压与浪费；而设备自动化与远程监控则降低了维修与人力成本。同时，借助大数据分析技术，园区可精准把握产业趋势，优化招商策略，提高入驻企业满意度与营收水平。此外，智慧园区的低碳节能设计，通过能源分析与精细化管理，实现了能耗的显著降低，为园区可持续发展奠定了坚实基础。总之，这一综合解决方案不仅让园区管理变得更加智慧、高效，更为入驻企业与员工带来了更加舒适、便捷的工作与生活环境，是未来园区建设的必然趋势。

大型集团用户画像系统化标准化数字化用户主数据管理项目规划方案.pptx: 大型集团用户画像系统化标准化数字化用户主数据管理项目规划方案

基于STM32的水质浊度检测仪设计与实现（详细设计说明书+ 10008-基于STM32的水质浊度检测仪设计与实现（详细设计说明书+原理图PCB工程+源码工程+实物照片）本次设计是设计一款水质检: 基于STM32的水质浊度检测仪设计与实现（详细设计说明书+ 10008-基于STM32的水质浊度检测仪设计与实现（详细设计说明书+原理图PCB工程+源码工程+实物照片）本次设计是设计一款水质检测设备，实现温度检查、水质检测的功能，将检测到的数据显示到显示器中，并实时记录系统的参数本次系统需要对温度检测，使用的传感器为DS18B20，通过单总线的方式来完成系统温度检测使用水质检测模块检查水的质量通过传感器检测到的数据计算后的值实时刷新到显示器中，主要的功能包括以下几点： ①可以对温度实时检测； ②可以对水质实际值实时检测； ③水质浑浊预警主要特点： 1．以STM32单片机为核心，配合水质模块； 2．主要完成系统的功能控制、状态显示、信息检测以及报警硬件组建所单片机和传感器等元器件的选择； 3．完成系统控制的软件设计编程； 4．实现对水质检测、温度检查、预警的功能内容包含： 1、原理图工程 2、PCB工程 3、源码工程 4、实物照片 5、详细介绍说明书-22531字 6、实物照片 7、浊度传感器资料

人脸识别_seetaface6_SDK_多功能应用开发工具包_1741771332.zip: 人脸识别项目实战

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

[hadoop2.7.1]I/O之序列化（WritableSerialization）示例

评论

发表评论

相关推荐

最近访客更多访客>>