本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
zysnba - xiangjie88
- sgqt
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wallimn
- wy_19921005
- vipbooks
- benladeng5225
- 龙儿筝
- javashop
- ranbuijj
- fantaxy025025
- zw7534313
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- jh108020
- wiseboyloves
- xiangjie88
- ganxueyun
- xyuma
- wangchen.ily
- lemonhandsome
- jbosscn
- zxq_2017
- mengjichen
- luxurioust
- lzyfn123
- forestqqqq
- nychen2000
- wjianwei666
- Xeden
- zhanjia
- ajinn
- hanbaohong
- 喧嚣求静
- jickcai
- kingwell.leng
- mwhgJava
- silverend
- lich0079
- lchb139128
最新文章列表
阿里HBase超详实践总结 | 一文读懂大数据时代的结构化存储
前言
时间回到2011年,Hadoop作为新生事物,在阿里巴巴已经玩得风生水起,上千台规模的”云梯”是当时国内名声显赫的计算平台。
这一年,Hadoop的好兄弟HBase由毕玄大师带入淘宝,开启了它的阿里之旅。从最初的淘宝历史交易记录,到去年的支付宝消费记录存储在线历史存储统一;从蚂蚁安全风控的多年存储演进,到HBase、TT、Galaxy的大数据激情迭代;HBase在阿里经历过年轻的苦涩,释放过 ...
如何使用scala+spark读写hbase?
最近工作有点忙,所以文章更新频率低了点,希望大家可以谅解,好了,言归正传,下面进入今天的主题:
如何使用scala+spark读写Hbase
软件版本如下:
scala2.11.8
spark2.1.0
hbase1.2.0
公司有一些实时数据处理的项目,存储用的是hbase,提供实时的检索,当然hbase里面存储的数据模型都是简单的,复杂的多维检索的结果是在es里面存储的,公司也正 ...
HBase集群环境安装
参考
http://blog.csdn.net/M_SIGNALs/article/details/52948867
>>>hive与hbase集成(https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration)
hive/lib/ hbase/lib
1.查看guava-12.0.1.jar ...
spark读取hbase数据
package ceshi
import java.io.IOException
import java.util
import java.util.{Random, UUID}
import org.apache.hadoop.conf.Configuration
import org.apache.hadoop.hbase.HBaseConfiguration
import ...
细说分布式Redis架构设计和踩过的那些坑
摘要:本文章主要分成五个步骤内容讲解
Redis、RedisCluster和Codis;
我们更爱一致性;
Codis在生产环境中的使用的经验和坑们;
对于分布式数据库和分布式架构的一些看法;
Q & A环节。
Codis是一个分布式Redis解决方案,与官方的纯P2P的模式不同,Codis采用的是Proxy-based的方案。今天我们介绍一下Codis及下一个大版本 ...
Hadoop生态圈完全分布式集群环境搭建
一:事前准备工作:
1.最少4台服务器,当然也可以为虚拟机
2.hadoop、hbase、spark、jdk、zookeeper的安装包(需要版本都是相互兼容的,这个可以从官网看到)
3.系统为centos7
如果是新学者可以看我另一篇关于单节点大数据环境部署和安装的文章
二:Linux系统配置
更改linux名称
hostnamectl set-hostname host ...
hbase表数据备份策略
Hbase的数据备份策略有:
(1)Distcp
(2)CopyTable
(3)Export/Import
(4)Replication
(5)Snapshot
下面介绍这几种方式:
(一)Distcp(离线备份)
直接备份HDFS数据,备份前需要disable表,在备份完成之前
服务不可用对在线服务类业务不友好
(二)CopyTable(热备)
执行命 ...
导出HBase数据到Excel(Java代码)
一、主要代码
package com.sgcc.mcsas.bigdata.tool;
import com.sgcc.mcsas.bigdata.service.HBaseServiceImpl;
import com.sgcc.mcsas.bigdata.service.IHBaseService;
import org.apache.hadoop.hbase.Cell;
...
hbase分布式安装
Hbase有几种安装的方法,这里要讲的是在学习过程中用几台虚拟机模拟的分布式安装。
1.首先,下载Hbase对应的包,要注意需要下载和hadoop版本相对应的hbase版本,防止产生不兼容的问题,具 体版本对应可以再apache官网进行查询。(hbase-0.98.4-hadoop2与hadoop-2.3.0)
2.解压包后,将hbase-0.98.4-hadoop2放在/h ...
storm trident实战 trident state
一、认识storm trident trident可以理解为storm批处理的高级抽象,提供了分组、分区、聚合、函数等操作,提供一致性和恰好一次处理的语义。 1)元祖被作为batch处理 2)每个batch的元祖都被指定唯一的一个事物id,如果因为处理失败导致batch重发,也和保证和重发前一样的事物id 3)数据更新操作严格有序,比如batch1必须在batch2之前被 ...
最近博客热门TAG
Oracle(49876) MySQL(37268) SQL Server(17623) Access(9329) DB2(4271) Redis(3181) Sybase(2414) 数据挖掘(2098) MongoDB(2014) SQLite(1817) PostgreSQL(1635) HBase(1492) NoSQL(1000) HSQLDB(620) Informix(581) Derby(578) Cassandra(375) PowerBuilder(333) CouchDB(113) TokyoCabinet(87)