本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- zysnba
- xiangjie88
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sichunli_030
- sam123456gz
- 龙儿筝
- arpenker
- tanling8334
- kaizi1992
- gaojingsong
- xpenxpen
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- lemonhandsome
- luxurioust
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- kingwell.leng
- mwhgJava
- lich0079
最新文章列表
设计一套实时分布式日志流收集平台(tail Logs --->HDFS)
目前业界大概这么几个开源的分布式日志系统,notify+rsync,Facebook 的Scribe,apache的chukwa,linkin的kafa和cloudera的flume。
之所以自己设计一台这么一个平台,而没有采用开源,主要是基于这么考虑
1、以上这几种开源日志系统,虽然提供了日志tail实时输出的功能,但是在tail进程宕掉后,无法从收集的点开始收集,只能重新开始,这样 ...
Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift有何不同?
1. HDFS使用集中式单一节点架构(NameNode)来维护文件系统元数据,而在Swift中,元数据分布在整个集群中并拥有多个副本。注意:集中式元数据存储使HDFS存在性能、单点故障和扩展性问题,因此规模越大就性能越低,就越容易不可用,就越难扩展甚至不能扩展,所幸的是HDFS2使用NameNode HA和HDFS Federation解决了这三个问题。
2. Swift在设计时考虑到了多租户 ...
HDFS写文件过程 源码分析
HDFS写入文件的重要概念
HDFS一个文件由多个block构成。HDFS在进行block读写的时候是以packet(默认每个packet为64K)为单位 进行的。每一个packet由若干个chunk(默认512Byte)组成。Chunk是进行数据校验的基本单位,对每一个chunk生成一个校验和(默 认4Byte)并将校验和进行存储。
在写入一个block的时候,数据传输的基本单位是packet,每 ...
使用Fuse挂载HDFS
前提,已经安装好hadoop集群
1. 安装fuse 这里可以编译安装或yum安装
Shell代码
yum install fuse fuse-libs fuse-devel
2. 安装ant 使用yum安装
Hadoop 2.1.0 beta HDFS SnapShot 介绍
Hadoop 2.1.0 Beta 版 HDFS 提供了SnapShot 模块。用于数据备份、回滚。已防止因用户的失误操作导致集群出现问题。本文先做一个简单的介绍,其他的文章在来介绍Snapshot 本身的实现机制。
首先
HDFS 的Snapshot 大概有以下几个特性:
Snapshot 创建的时间 复杂度为O(1),但是不包括INod ...
eclipse 上传文件到hadoop
其实很简单,只要配置正确,就行
直接给代码吧
package com.younglibin.hadoop;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.a ...
java api 操作hdfs文件
package com.bfd.test;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import org.apache.commons.lang.math.NumberUtils;
import org.ap ...
hdfs在手机下载平台中的应用
在我们的手机应用商店项目中,随着第三方应用的增长,传统的文件系统已经无法满足下载包的存储,经过初步考虑,我们打算使用hdfs来存储我们的下载包。
hdfs作为一种分布式存储方案,在可扩展性,稳定性方面有很大的优势,当磁盘不够时,只需要添加datanode,不影响下载服务,当一台datanode机器网络或硬件出现问题,也不会影响下载服务,hdfs会自动把出问题的datanode上的数 ...
Hypertable on HDFS(hadoop) 安装
Hypertable on HDFS(hadoop) 安装
Hadoop - HDFS 安装指南
过程 4.2. Hypertable on HDFS
创建工作目录
$ hadoop fs -mkdir /hypertable
$ hadoop fs -chmod 777 /hypertable
安装 Java 运行环境
yum ins ...
Hadoop HDFS RPM包安装方案
文章出处:http://netkiller.github.io/storage/hdfs.html
5.2. Hadoop HDFS RPM包安装方案
你是不是感觉hadoop 安装太复杂呢? 下面是无障碍,无门槛安装方案,非常适合不懂java得系统管理。
HDFS: NameNode :管理节点 DataNode :数据节点 Se ...
hadoop hdfs JAVA API 基本文件操作
本文主要介绍了 HADOOP HDFS JAVA API 对HDFS中的文件操作,如:创建文件,将文件上传到HDFS,从HDFS下载文件到本地,HDFS文件删除等
话不多说,上代码:
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream ...
Hypertable + Ceph 分布式文件系统
我最近在研究Hypertable, Hypertable 安装分为单机安装与分布式文件系统,单击安装主要用于开发环境。生产环境一般都是采用分布式文件系统。Hypertable 系统以下几种组合。
Hypertable + HDFS(Hadoop)
Hypertable + KFS
Hypertable + MapR
Hypertable + ThriftBroker
...
Hadoop HDFS架构和设计
引言
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现 ...
查看HBase表在HDFS中的文件结构
为了查看HBASE表在HDFS中的文件结构.
在HBASE中建立一张表结构如下:
{NAME => 'USER_TEST_TABLE',
MEMSTORE_FLUSHSIZE => '67108864',
MAX_FILESIZE => '1073741824',
FAMILIES => [
{NAME => 'info', BLOOMFILTER ...