最新文章列表

hadoop hdfs读写

hadoop hdfs读写   hdfs读取文件 1.FSDataInputStream,open创建输入流,建立与nameNode的连接 2.调用getBlockLoction获得hdfs文件的数据块位置 3.FSDataInputStream, read根据数据块位置,建立与datanode的连接,读取数据块 4.在读取到数据块末端的时候,关闭与datanode的连接 5.重复 ...
blackproof 评论(0) 有1034人浏览 2014-07-20 14:04

003_HDFS详解

003_HDFS详解 其实应该先来教大家怎么样搭建完全分布式的,由于时间原因,以后再补上。 这篇主要聊一下Hadoop分布式文件系统——HDFS 大纲: 1.HDFS设计目标 2.HDFS里面的NameNode和DataNode 3.操作HDFS的两种方式 1.HDFS设计目标 硬件错误 硬件错误是常态而不是异常。(每每读这句我就想到了:程序员加班是常态不是异常)HDFS可能由 ...
zc985552943 评论(1) 有1535人浏览 2014-07-02 16:03

002_看大纲_hadoop大纲

002_看大纲_hadoop大纲 通过前面一节可以了解一个大概,知道云计算的含义和hadoop的生态体系 知识链接:001_扎马步_初识hadoop  Hadoop有两大部分:HDFS+MapReduce 其中HDFS实现分布式存储的底层支持,Mapreduce来实现分布式并行计算。 HDFS采用主从结构模型。一个master,若干个slave。对应到集群中由一个NameNode和若干 ...
zc985552943 评论(1) 有943人浏览 2014-07-02 14:00

hdfs-ha热备原理

下面的总结来自于:http://dongxicheng.org/hadoop-hdfs/hdfs-ha-federation-deploy/               Hadoop 2.0中的HDFS增加了两个重大特性,HA和Federaion。HA即为High Availability,用于解决NameNode单点故障问题,该特性通过热备的方式为主NameNode提供一个备用者,一旦主Na ...
dengqsintyt 评论(0) 有1887人浏览 2014-06-21 22:43

hadoop-hdfs整体结构剖析

这篇文章,大约在2011年在原来的博客中写的。今天突然看到再写到这篇文章中,就当日记啦。   一:Hadoop整体模块交互       分布式文件系统,思想是,把数据放到一个服务器集群上面,分为:主控服务器Master/NameNode),数据服务器(ChunkServer/DataNode),和客户服务器Client.HDFS和GFS都是按照这个架构模式搭建的。       最核心内容 ...
dengqsintyt 评论(0) 有1036人浏览 2014-06-15 16:20

分布式文件系统

分布式文件系统介绍 什么是分布式文件系统: 分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。 常见分布式文件系统: 常见的分布式文件系统有NFS、KFS、AFS、HDFS等。下面我们对NFS、KFS、AFS进行简单介绍: NFS(Netwo ...
香煎马鲛鱼 评论(0) 有2127人浏览 2014-06-10 16:59

HDFS的基本概念

1、数据块(block) HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。 和普通文件系统相同的是,HDFS中的文件是被分成64M一块的数据块存储的。 不同于普通文件系统的是,HDFS中,如果一个文件小于一个数据块的大小,并不占用整个数据块存储空间。 2、元数据节点(Namenode)和数据节点(datanode) namen ...
雨一直下 评论(0) 有442人浏览 2014-05-09 11:35

hdfs读取文件出发java.io.EOFException异常

[2014-05-05 17:42:51] [main] DEBUG - Error making BlockReader. Closing stale NioInetPeer(Socket[addr=/XXXXX,port=50010,localport=55897])  java.io.EOFException: Premature EOF: no length prefix availa ...
lvdccyb 评论(0) 有17193人浏览 2014-05-05 17:50

Hadoop笔记 HDFS(一)

一、常用命令 hadoop fs -copyFromLocal src_local dest_hdfs hadoop fs -copyToLocal src_hdfs dest_local hadoop fs -mkdir dir_name hadoop fs -lsr dir_name hadoop fs -cat hadoop fs -chgrp hadoop fs -chmo ...
hxl1988_0311 评论(0) 有604人浏览 2014-04-21 23:29

Hadoop 1.0安装配置

1部署介绍 1.1环境说明          集群中包括4个节点:1个Master,3个Salve,节点之间局域网连接,可以相互ping通。节点IP地址分布如下: 机器名称
leoleo1949 评论(0) 有586人浏览 2014-04-10 14:25

几种分布式文件系统的测试分析

前些日子调研分布式文件系统的时候,在google上找到了一个很好的测试分析报告,在这里分享给大家,是全英文版的,看起来得耐心点,我主要看了hdfs,moosefs和ceph的。   最好是自己动手搭建一些集群试试。并且多做测试。以便帮助选型。
xiaoyu966 评论(0) 有1109人浏览 2014-03-14 17:55

hadoop 2.3.0 搭建指南

一. 准备工作(搭建环境:Ubuntu 12.04)  假设我们有三台机器。一台做master,另外两台做slave。所有的操作都先只在master上操作,然后scp同步到slaves。 1、创建hadoop用户,建立master到两台slaves的信任关系(如何建立,可以百度一下)   [plain] view plaincopyprint? adduser h
yxw22 评论(0) 有605人浏览 2014-03-14 17:42

hadoop学习笔记-java操作hdfs

使用Hadoop的java api 针对HDFS进行文件上传、创建、重命名、删除操作:   package hadoop.hdfs; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import java.net.URI; import java.ne ...
yehao0716 评论(0) 有810人浏览 2014-02-26 22:53

异常java.lang.IllegalArgumentException: Wrong FS: hdfs:/, expected: file:///

  在hadoop-2.2.0版本中对hdfs进行简单的测试操作,代码如下所示 Configuration conf = new Configuration(); try { FileSystem fs = FileSystem.get(conf); Path f = new Path("hdfs:///dfs_operator.txt"); FSDataO ...
pgwcumt 评论(0) 有8688人浏览 2014-02-25 15:46

用MapReduce操作mongodb与hdfs的读写例子

需要引入的类包:mongo-java-driver-2.11.2.jar、mongo-hadoop-core_1.0.4-1.1.0.jar 一、从MongoDB上读数据,进行MapReduce后,把结果在在HDFS上。 1、Job的配置启动类: package com.test.similarity.dataimport; import org.apache.hadoop.con ...
szjian 评论(3) 有7169人浏览 2014-02-13 13:50

Hadoop技术内幕_深入解析Hadoop Common和HDFS架构设计与实现原理——读书笔记(2)

第2章 Hadoop配置信息处理 2.1 配置文件简介  1.  windows 操作系统的配置文件:后缀为 ini            java解析 ini 配置文件第三方API有:           (1) JCom包:下载JCom-2.2.0-1.jar           (2) Apache Commons 工具集:下载commons-configuration-1.10 ...
cumtheima 评论(0) 有2007人浏览 2014-01-24 12:50

Hadoop技术内幕_深入解析Hadoop Common和HDFS架构设计与实现原理——读书笔记(1)

第1章 源代码环境准备          1.1 Hadoop生态系统         (a). Hadoop Common: 为Hadoop的其它项目提供一些常用工具,主要包括系统配置工具Configuration、远程过程调用RPC、序列化机制和Hadoop抽象文件系统FieSystem等。         (b). Avro: 是一个数据序列化系统。可以将数据结构或者对象转换成便于 ...
cumtheima 评论(0) 有4473人浏览 2014-01-24 09:51

The Design of HDFS

HDFS is a filesystem designed for storing very large files with streaming data access patterns, running on clusters of commodity hardware. Let’s examine this statement in more detail: Very large fil ...
yangshangchuan 评论(0) 有3082人浏览 2014-01-12 01:28

如何使用Java API读写Hbase

Hbase是够建在HDFS之上的半结构化的分布式存储系统,具有HDFS的所有优点,同时也有自己的亮点,支持更快速的随机读写以及更灵活的Scan操作,而在HDFS上这一点我们是远远做不到的,因为HDFS仅支持Append追加操作,而且也不具备随机读写一条数据的功能,实际上HDFS扫描的范围按Block来算的,所以从某个角度来言,Hbase利用Schemal的方式做到了这一点。 一般情况下,我们使用L ...
qindongliang1922 评论(0) 有9443人浏览 2013-11-28 20:04

如何使用Java API读写HDFS

HDFS是Hadoop生态系统的根基,也是Hadoop生态系统中的重要一员,大部分时候,我们都会使用Linux shell命令来管理HDFS,包括一些文件的创建,删除,修改,上传等等,因为使用shell命令操作HDFS的方式,相对比较简单,方便,但是有时候,我们也需要通过编程的方式来实现对文件系统的管理。 比如有如下的一个小需求,要求我们实现读取HDFS某个文件夹下所有日志,经过加工处理后在写入 ...
qindongliang1922 评论(4) 有12372人浏览 2013-11-27 20:35

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics