给个源码下载地址:http://www.apache.org/dyn/closer.cgi/hbase/
编译过程:
1.需要安装(必须安装前三个,都非常好安装,直接export就好了)
Maven 3.3.1
findbugs 3.0.1
Java 1.7.0_06
Hadoop 2.2.0
HBase 0.98.1
2.生成pom
修改generate-hadoopX-poms.sh中的hbase_home="${HBASE_HOME}"
hbase_home="下载的hbase源码路径"
运行生成pom.xml.hadoop2
bash -x ./dev-support/generate-hadoopX-poms.sh 0.98.1 0.98.1-hadoop2
3.编译源码
mvn -f pom.xml.hadoop2 install -DskipTests assembly:single -Prelease
编译的过程可能会报很多的错,例如:
Connect to people.apache.org:80 [people.apache.org/140.211.11.9] failed: Connection timed out
这是因为在运行一些common或是server包里的test连接这个网站需要的,可是people.apache.org总是连接超时
我没啥好办法,可以注释掉这些test,或是多试几次,就连上了
Failed to execute goal org.apache.rat:apache-rat-plugin
Apache RAT (Release Audit Tool) 是一个用来检查软件许可证发行的准确性和高效性的工具。它的本质是:对可能出现的问题作出预测(跟没说一样)
<plugin> <!-- excludes are inherited --> <groupId>org.apache.rat</groupId> <artifactId>apache-rat-plugin</artifactId> <version>0.8</version> <configuration> <excludes> <exclude>**/*.versionsBackup</exclude> <exclude>**/*.log</exclude> <exclude>**/.*</exclude> <exclude>**/*.tgz</exclude> <exclude>**/*.orig</exclude> <exclude>**/8e8ab58dcf39412da19833fcd8f687ac</exclude> <exclude>**/a6a6562b777440fd9c34885428f5cb61.21e75333ada3d5bafb34bb918f29576c</exclude> <exclude>**/.git/**</exclude> <exclude>**/.idea/**</exclude> <exclude>**/*.iml</exclude> <exclude>**/target/**</exclude> <exclude>**/CHANGES.txt</exclude> <exclude>**/generated/**</exclude> <exclude>**/gen-*/**</exclude> <exclude>**/conf/*</exclude> <exclude>**/*.avpr</exclude> <exclude>**/*.svg</exclude> <exclude>**/META-INF/services/**</exclude> <!-- MIT: https://github.com/twbs/bootstrap/blob/master/LICENSE --> <exclude>**/bootstrap-theme.css</exclude> <exclude>**/bootstrap-theme.min.css</exclude> <!-- MIT http://jquery.org/license --> <exclude>**/jquery.min.js</exclude> <!-- vector graphics --> <exclude>**/*.vm</exclude> <!-- apache doxia generated --> <exclude>**/control</exclude> <exclude>**/conffile</exclude> <exclude>docs/*</exclude> <exclude>logs/*</exclude> <!-- auto-gen docs --> <!--It don't like freebsd license--> <exclude>**/src/main/site/resources/css/freebsd_docbook.css</exclude> <!-- exclude source control files --> <exclude>.git/**</exclude> <exclude>.svn/**</exclude> <exclude>**/.settings/**</exclude> </excludes> </configuration> </plugin>
我的解决方法是注释掉,不知道其他人有没有好的解决方法,
贴个相似的帖子:http://bupt04406.iteye.com/blog/1997376
在编译成功后,hbase-assembly/target目录下,有hbase-0.98.1-hadoop2-bin.tar.gz
解压部署到集群
cdh无需生成hadoop1或2,直接执行mvn -f pom.xml install -DskipTests assembly:single -Prelease
相关推荐
源码包“hbase-0.98.1-src.tar.gz”提供了HBase 0.98.1版本的完整源代码,对于理解其内部工作原理、进行二次开发或调试是非常有价值的。 HBase的核心概念包括: 1. 表:HBase中的表由行和列族组成,表名全局唯一。...
《HBase 0.98.1-hadoop2 API》是关于HBase数据库的一个特定版本的API参考文档,主要用于帮助开发者理解和使用这个基于Hadoop的数据存储系统。HBase是Apache软件基金会开发的一个开源NoSQL数据库,它构建在Hadoop...
### Hadoop2.2.0 + HBase0.98.1 + Sqoop1.4.4 + Hive0.13 完全安装手册 #### 前言 随着大数据技术的发展,Hadoop已经成为处理海量数据的核心框架之一。本文旨在为读者提供一套最新的Hadoop2.2.0、HBase0.98.1、...
在本文中,我们将深入探讨如何在Hadoop 2.4.1环境中自编译和安装HBase 0.98.5。这是一个重要的步骤,因为HBase是一个分布式、基于列族的NoSQL数据库,它构建在Hadoop之上,提供高吞吐量的数据访问。Hadoop 2.4.1是...
《HBase实战源码》是针对Apache HBase这一分布式、高性能、基于列族的NoSQL数据库的深度解析书籍。源码分析是理解HBase工作原理和技术细节的重要途径。HBase在大数据领域扮演着关键角色,它能够处理海量数据并提供...
同时,还提供了 Kettle 5.2 源码编译的方法,这对于开发者来说是宝贵的资源,有助于他们更深入地理解和定制 Kettle 工具。在实际应用中,这些连接和编译技巧将帮助数据工程师高效地处理大数据工作流程。
hbase2.3.5+spark-3.0.3源码编译包
《CDH5.13与Phoenix 4.11.0-HBase 1.2源码编译详解》 在大数据处理领域,Cloudera Data Hub(CDH)作为一个全面的开源大数据平台,深受广大用户的青睐。CDH5.13版本是其重要的一个迭代,集成了多种组件,如Hadoop、...
《深入理解HBase:源码剖析与测试实践》 HBase,全称为Hadoop Database,是一种基于Apache Hadoop的开源分布式非关系型数据库。它的设计灵感来源于Google的Bigtable,旨在处理大规模数据集,通常在PB级别以上。...
HBase源码分析揭示了HBase在RPC通信机制方面的一些关键技术点,这包括了角色分配、通信信道建立、通信接口协议定义、对象序列化、传输控制和会话管理,以及在传输过程中可能出现的错误处理和重试机制。 HBase中的...
《HBase权威指南》是一本深入探讨分布式大数据存储系统HBase的专业书籍,其源码提供了对书中各个章节涉及技术的直观展示和实践操作。源码分析可以帮助读者更好地理解和应用书中的理论知识,以下是对这份源码包中可能...
HBase 1.2.0是该数据库的一个稳定版本,包含了众多优化和改进,对于想要深入理解HBase工作原理或者进行大数据分析的学习者来说,研究其源码是非常有价值的。 一、HBase架构与核心概念 1. 表与Region:HBase中的...
《深入剖析HBase 0.94.4源码》 HBase,作为一个基于Google Bigtable设计灵感的开源分布式数据库,是Apache Hadoop生态系统中的重要组成部分。本文将围绕HBase 0.94.4这一稳定版本的源码展开,探讨其核心设计理念、...
### HBase源码解析与开发实战 #### 一、HBase简介 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 论文 “Bigtable:一个结构化数据的分布式存储系统”。就像 Bigtable 利用了...
在HBase 1.3.1的源码中,我们可以深入理解这个系统的内部工作原理,包括以下几个关键知识点: 1. **Maven构建系统**:HBase使用Maven作为构建工具,源码组织结构遵循Maven的标准目录结构,如src/main/java存放Java...
《深入理解HBase:从HBaseTest源码解析开始》 HBase,作为Apache软件基金会的一个开源项目,是构建在Hadoop之上的分布式列式数据库,特别适合处理大规模数据。其设计灵感来源于Google的Bigtable,提供高吞吐量的...
Hbase权威指南 随书源代码 源码包 绝对完整版 maven工程,带pom文件,可以直接作为一个完整工程导入eclipse等ide。
《深入剖析HBase源代码:hbase-0.98.23》 HBase,作为Apache的一个开源项目,是构建在Hadoop之上的分布式、版本化、列族式的NoSQL数据库,它提供了高可靠性、高性能、可伸缩的数据存储解决方案。本文将基于hbase-...