Hadoop组件之-HIVE(位图索引)

博客分类：

Hadoop

索引概述什么是索引？索引是Oracle数据库中提供的一种可选的数据结构，用于关联一个表。为什么要使用索引？索引在有些情况下可以加快访问速度，减少磁盘IO。通常情况下时候使用索引？表中的某列经常会在查询中使用，并且经常用返回占表中数据总量比例较少的row set。引用完整性约束列。 unique key 。下面我们来简述一下两种常见的索引类型：B-Tree索引以及BitMap索引。

2016-06-24 15:43
浏览 1581
评论(0)
分类:开源软件

Hadoop NameNode 高可用 (High Availability) 实现解析在 Hadoop 的整个生态系统中，HDFS NameNode 处于核心地位，NameNode 的可用性直接决定了 Hadoop 整个软件体系的可用性。本文尝试从内部实现的角度对 NameNode 的高可用机制进行详细的分析，主要包括 NameNode 的主备切换实现分析和 NameNode 的共享存储实现分析。文章的最后在结合作者自身实践的基础上，列举了一些在高可用运维过程中需要注意的事项。

2016-06-23 10:10
浏览 2657
评论(0)
分类:开源软件

Hadoop组件之-HDFS(FederationAndHA)

博客分类：

Hadoop

一、背景天云趋势在2012年下半年开始为某大型国有银行的历史交易数据备份及查询提供基于Hadoop的技术解决方案，由于行业的特殊性，客户对服务的可用性有着非常高的要求，而HDFS长久以来都被单点故障的问题所困扰，直到Apache Hadoop在2012年5月发布了2.0的alpha版本，其中MRv2还很不成熟，可HDFS的新功能已经基本可用，尤其是其中的的High Availability(以下简称HA)和Federation。Cloudera也于7月制作了CDH4.0.1，包含了Hadoop 2.0的诸多新功能和组件，于是我们就基于CDH4.0.1进行了HA和Federation的测试 ...

2016-06-23 10:06
浏览 918
评论(0)
分类:开源软件

Spark-SQL简介

博客分类：

Hadoop

分享到...

2016-01-11 22:09
浏览 1348
评论(0)
分类:开源软件

Python-With...As语法

博客分类：

Hadoop

理解Python中的with…as…语法 Posted in python - 22 五月, 2013 - 2 Comments 使用语言的好特性，而不是那些糟糕的特性————不知道谁说的好久不学习python的语法了，上次去面试，和面试官聊到了python中的with-as statement（也称context manager），挺感兴趣的，这两天学习了一番，收获颇丰在此分享。先说明一个常见问题，文件打开：

2015-12-22 14:12
浏览 877
评论(0)
分类:开源软件

Linux-RPM详解

博客分类：

Hadoop

rpm命令手册和查看rpm安装包的安装路径的方法来源：互联网作者：佚名时间：04-22 14:07:45 【大中小】 rpm -qpl xxxxxx.rpm 1.如何安装rpm软件包 rmp软件包的安装可以使用程序rpm来完成。执行下面的命令 rpm -i your-package.rpm 其中your-package.rpm是你要安装的rpm包的文件名，一般置于当前目录下。安装过程中可能出现下面的警告或者提示： ... conflict with .

2015-12-12 14:22
浏览 782
评论(0)
分类:开源软件

Linux-NTP服务配置

博客分类：

Hadoop

配置NTP服务ntpd/ntp.conf（搭建Hadoop集群可参考）标签： ntpntpdntp.conf 2014-11-24 08:55 5915人阅读评论(0) 收藏举报

2015-12-10 20:51
浏览 761
评论(0)
分类:开源软件

Hadoop组件之-MapReduce(InputFormat)

博客分类：

Hadoop

Hadoop源码解析之: TextInputFormat如何处理跨split的行标签： hadoopsplitTextInputFormat跨split 2013-07-19 14:44 6402人阅读评论(1) 收藏举报

2015-12-07 20:03
浏览 648
评论(0)
分类:开源软件

Hadoop组件之-Sqoop

博客分类：

Hadoop

前置条件已经成功安装配置Hadoop和Mysql数据库服务器，如果将数据导入或从Hbase导出，还应该已经成功安装配置Hbase。下载sqoop和Mysql的JDBC驱动 sqoop-1.2.0-CDH3B4.tar.gz ：http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz mysql-connector-java-5.1.28

2015-12-07 17:33
浏览 900
评论(0)
分类:开源软件

Hadoop组件之-Kafka

博客分类：

Hadoop

一、入门 1、简介 Kafka is a distributed,partitioned,replicated commit logservice。它提供了类似于JMS的特性，但是在设计实现上完全不同，此外它并不是JMS规范的实现。kafka对消息保存时根据Topic进行归类，发送消息者成为Producer,消息接受者成为Consumer,此外kafka集群有多个kafka实例组成，每个实例(

2015-12-07 17:32
浏览 834
评论(0)
分类:开源软件

Hadoop企业级搭建之-Cloudera产品部署

博客分类：

Hadoop

2015-11-30 22:12
浏览 1935
评论(0)
分类:开源软件

Hadoop企业级搭建之-版本选择

博客分类：

Hadoop

太多选择——如何挑选合适的大数据或Hadoop平台? 作者 Kai Wähner ，译者王灵军发布于 2013年10月9日 | 注意: ArchSummit全球架构师峰会（北京）2015年12月18-19日，

2015-11-27 14:37
浏览 1073
评论(0)
分类:开源软件

Hadoop企业级搭建之-组网设计方案理解

博客分类：

Hadoop

深入理解Hadoop集群和网络发表于2012-08-30 14:09| 次阅读| 来源个人博客| 0 条评论| 作者Brad Hedlund Hadoop大数据虚拟化服务器摘要：本文将着重于讨�

2015-11-27 14:08
浏览 1347
评论(0)
分类:开源软件

Hadoop企业级搭建之-组网设计(收敛比)

博客分类：

Hadoop

高性能数据中心网络的流量收敛设计收藏打印推荐

2015-11-27 13:55
浏览 1309
评论(0)
分类:开源软件

FIND

find命令查找包含指定内容的文件 2011-09-05 18:59 10285人阅读评论(0) 收藏举报 shellfilecommandfunctionuserbuild

2014-12-25 17:11
浏览 442
评论(0)
分类:操作系统

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop组件之-HIVE(位图索引)

Hadoop组件之-HDFS(HA实现细节)

Hadoop组件之-HDFS(FederationAndHA)

Spark-SQL简介

Python-With...As语法

Linux-RPM详解

Linux-NTP服务配置

Hadoop组件之-MapReduce(InputFormat)

Hadoop组件之-Sqoop

Hadoop组件之-Kafka

Hadoop企业级搭建之-Cloudera产品部署

Hadoop企业级搭建之-版本选择

Hadoop企业级搭建之-组网设计方案理解

Hadoop企业级搭建之-组网设计(收敛比)

FIND

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>