如何在mapreduce方法中获取当前使用文件（get file name） - 空中的鱼 - ITeye博客

`

lookqlp

浏览: 348683 次
性别:
来自: 上海

最近访客更多访客>>

jlbhdfsl

louShang123

ssydxa219

yc_zlj

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

tpxcer：不开启时可以的，而且开启以后各种坑。。。。
hue beeswax权限管理
yangze：博主请教一个问题，hue 控制hive表的权限怎么弄？怎么联 ...
cloudera新增用户权限配置
linux91：楼主你好，我用CM配置LDAP用户组映射，进入impala时， ...
sentry配置
linux91：版主：按你的步骤配置了，可是，执行 impala-shell ...
impala集成LDAP
lookqlp： super_a 写道你好！找不到表这个问题是如何解决的，可以描 ...
hcatalog读取hive数据并写入hive

如何在mapreduce方法中获取当前使用文件（get file name）

博客分类：

hadoop

hadoop mapreduce filename

阅读更多

使用的0.20.2版本hadoop
查了许久，如何在map方法中获取当前数据块所在的文件名，方法如下：
//获取文件名
InputSplit inputSplit=(InputSplit)context.getInputSplit();
String filename=((FileSplit)inputSplit).getPath().getName();

分享到：

关于mapreduce解析xml的方法 | 如何提示mapreduce，查看systemout信息

2012-03-29 11:42
浏览 1902
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

mapreduce统计度分布: 在本案例中，“mapreduce统计度分布”是指使用MapReduce技术来实现一种特定的统计方法——度分布统计。 #### 二、背景与应用场景 **度分布统计**是图论中的一个重要概念，通常应用于社交网络分析、复杂网络研究等...

hdfs+MapReduce: Hadoop核心组成部分包括HDFS（Hadoop Distributed File System）和MapReduce。本文档将详细介绍HDFS和MapReduce的基础知识与操作步骤。 ### HDFS分布式文件系统 HDFS是Hadoop项目的核心组件之一，它被设计为支持大...

在Windows上安装Hadoop HDFS和MapReduce框架1: - 使用命令`hadoop fs -get /test/localfile C:\destination`从HDFS下载文件到本地。通过以上步骤，可以在Windows环境下成功安装Hadoop HDFS和MapReduce框架，并进行基本的功能验证。这为后续进行大数据处理和分析...

一步一步跟我学习hadoop(6)----hadoop利用FileSystem API 执行hadoop文件读写操作: 这个例子中，我们使用`FileSystem API`读取输入文件，然后在MapReduce作业中处理数据。总结来说，`FileSystem API`是Hadoop生态系统中不可或缺的一部分，它为开发者提供了与各种文件系统交互的统一接口。通过熟练...

win安装部署hadoop3.0.0并启动上传文件到HDFS(博文相关代码): 在本文中，我们将深入探讨如何在Windows环境下安装和部署Hadoop 3.0.0，并进行基本的操作，如启动服务、上传文件到HDFS、创建目录以及运行MapReduce的WordCount示例。Hadoop是Apache基金会的一个开源项目，主要用于...

现有student.txt和student-score.txt 将两个文件上传到hdfs上使用Map/Reduce框架完成下面: **HDFS（Hadoop Distributed File System）**是Hadoop生态系统中的分布式文件系统，用于存储大量的数据集。HDFS的设计目的是为了满足在商用硬件集群上运行大数据处理应用的需求。它具有高容错性、易于扩展的特点，...

搭建hadoop后hdfs基本操作 ecplisec操作: 使用`FileSystem`的`listFiles(Path path, boolean recursive)`方法可以获取HDFS路径下的文件和子目录信息。例如： ```java Path path = new Path("/hdfsPath"); FileStatus[] statuses = fs.listStatus(path); ...

java大数据作业_4Zookeeper: 【Java大数据作业_4Zookeeper】的课后问题主要涵盖了Zookeeper在HBase中的作用、Zookeeper客户端连接信息获取、Zookeeper实现FIFO队列、MapReduce流程与中间结果的伪代码描述，以及倒排索引的编程实现。以下是详细...

hadoop环境安装: 在IT行业中，Hadoop是一个广泛使用的开源框架，主要用于大数据处理和分布式存储。本文将详细讲解如何在Ubuntu 14.04系统上安装Hadoop 2.4.0，涵盖单机模式的安装过程。首先，我们需要理解Hadoop的核心概念。Hadoop...

细细品味Hadoop_Hadoop集群VSFTP安装配置.rar_hadoop: 在IT行业中，Hadoop是一个广泛使用的开源框架，用于处理和存储大规模数据集。这个压缩包文件"细细品味Hadoop_Hadoop集群VSFTP安装配置.rar_hadoop"似乎属于一个系列教程，专注于Hadoop集群的构建与管理，特别是结合...

西南交通大学云计算与并行技术作业2: 【西南交通大学云计算与并行技术作业2】是关于在虚拟环境中搭建开源大数据处理平台Hadoop 3.0的实验任务，旨在让学生掌握Hadoop的安装、配置和使用。实验主要分为两个部分：单机版Hadoop的安装配置以及基于Hadoop的...

Hadoop下的shell命令: 例如，在处理大数据时，使用Hadoop Shell命令可以直接在命令行界面完成数据的上传、下载、查看等操作，极大地简化了工作流程。同时，在进行MapReduce作业的管理和监控时，这些命令也提供了非常便捷的方式。总之，...

大数据课程实验答案（林子雨）: 在该实验中，学员将学习如何编写MapReduce程序，通常使用Java编写，有时也会使用Python等语言。重点在于理解MapReduce的工作原理，即通过Map函数进行数据的过滤和映射，然后通过Reduce函数进行数据的汇总和处理。 ...

hadoop单节点安装.pdf: 在本文中，我们将深入探讨如何在Ubuntu 12.04 64位服务器上安装和配置Hadoop 2.2.0单节点环境。这个过程由雨水在2013年10月24日记录并发布在CSDN博客上。以下是详细的步骤：首先，确保你的环境准备就绪。这包括在...

windows安装hadoop: 它允许在廉价硬件上处理和存储大量数据，核心组件包括HDFS（Hadoop Distributed File System）和MapReduce。HDFS提供了高容错性的文件系统，而MapReduce则用于处理并行数据处理任务。在Windows上安装Hadoop，我们...

hadoop命令指南: `jar`命令用于运行包含在JAR文件中的MapReduce作业。 **命令格式**： ``` hadoop jar <jarfile> <main-class> [args] ``` **参数说明**： - `<jarfile>`：包含主类的JAR文件。 - `<main-class>`：包含main方法的...

Hadoop_HDFS_HBase在centos上部署: 在本文中，我们将深入探讨如何在CentOS操作系统上部署Hadoop HDFS和HBase。首先，我们来看一下Hadoop的部署过程。 ### 一、部署Hadoop #### 1. 安装Hadoop 3.1.3 安装Hadoop需要先确保你的系统满足其依赖项，比如...

03 云计算与大数据培训课程_Hadoop2.x64位伪分布式安装指南（Ubuntu）.zip: 在本课程中，我们将深入探讨“Hadoop 2.x 64位伪分布式安装”这一主题，这是一项针对云计算和大数据处理的关键技术。Hadoop 是一个开源框架，它允许高效地存储和处理海量数据，而伪分布式安装模式是单台机器上模拟...

hadoop-2.9.1.tar.gz: 1. 下载：从Apache官方网站获取Hadoop 2.9.1的tar.gz文件，如本案例中的"hadoop-2.9.1.tar.gz"。 2. 解压：使用`tar -zxvf hadoop-2.9.1.tar.gz`命令解压缩到指定目录，例如 `/usr/local/`。 3. 配置环境变量：编辑`...

在ubuntu上搭建hadoop总结: 在这个过程中，你将学习到Hadoop的配置、启动和测试方法。这只是一个基础起点，深入学习Hadoop还需要理解其背后的分布式原理和MapReduce编程模型。随着Hadoop生态系统的不断发展，如YARN、Spark等，持续学习和实践是...

Global site tag (gtag.js) - Google Analytics