maven POM.xml 标签详解

博客分类：

工具

<span style="margin: 0px; padding: 0px;"><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0http://maven.apache.org/maven-v4_0_0.xsd& ...

2016-01-04 00:25
浏览 744
评论(0)
分类:行业应用

Zookeeper是分布式环境下一个重要的组件

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

Zookeeper是分布式环境下一个重要的组件，因为它能在分布式环境下，给我带来很多便利，大大简化了分布式编程的复杂性，本篇散仙将给出一个模拟例子，来演示下如何使用Zookeeper的API编程，来完成分布式环境下配置的同步。大家都知道在一个中大型的规模的集群中，配置文件通常是必不可少的的东西，很多时候，我都需要将在Master上配置好的配置文件，给分发到各个Slave上，以确保整体配置的一致性，在集群规模小的时候我们可能简单的使用远程拷贝或复制即可完成，但是，当集群规模越来越大的时候，我们发现这种方式不仅繁琐，而且容易出错，最要命的是，以后如果改动配置文件的很少一部分的东西，都得需要把所有 ...

2016-01-03 00:02
浏览 492
评论(0)
分类:行业应用

Zookeeper的Session

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

介绍一下基于zookeeper的一些API的编程。在此之前，我们先来熟悉一下相关知识： Zookeeper的Session：（1）客户端和server间采用长连接（2）连接建立后，server产生session ID（64位）返还给客户端（3）客户端定期发送ping包来检查和� ...

2016-01-03 00:02
浏览 782
评论(0)
分类:行业应用

zookeeper的一系列基础知识

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

zookeeper的一系列基础知识，如果，你还不清楚zookeeper的基本架构，或者工作原理，那么，建议看一下散仙的上篇文章。本篇，散仙来介绍下怎么安装部署zookeeper，其实散仙在Hbase的安装部署里，已经介绍过独立的zookeeper的安装部署，本次除了zookeeper的集群安装外，还会额外介绍一下，怎么在zookeeper3.3.0之后的版本里，安装观察者角色(Observer)，以便使我们的集群能够获取更好的扩展性，与稳定性。 zookeeper的安装模式也有三种，分别是单机模式，伪分布模式，和完全分布式模式，本篇，散仙要介绍的是完全分布式模式。我们需要先下载好zook ...

2016-01-03 00:01
浏览 605
评论(0)
分类:行业应用

Zookeeper最早是Hadoop的一个子项目

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

Zookeeper最早是Hadoop的一个子项目，主要为Hadoop生态系统中一些列组件提供统一的分布式协作服务，在2010年10月升级成Apache Software Foundation(ASF)顶级项目，它主要提供以下的四个功能：功能名组管理服务分布式配置服务分布式同步服务分布式命名服务 Zookeeper的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户； Zookeeper的架构图如下： Zookeeper的特点如下：特点说明最终一致性为 ...

2016-01-03 00:01
浏览 581
评论(0)
分类:行业应用

Gradle是一款非常简洁的项目构建工具

博客分类：

工具

gradle

Gradle是一款非常简洁的项目构建工具，相比ant和maven的繁琐的xml配置，gradle提供了非常简洁的命令，而这正得益于它的底层语言Groovy，目前在Android的项目的中，几乎都是使用的gradle来管理项目，当然了除了这些它也对Java，JVM平台系语言，Scala等也良好支持，同时支持C/C++ ,并可以与Maven仓库无缝集成！目前最新Gradle版本：2.9 官网下载地址：http://gradle.org/gradle-download/ （1）下载到windows上某盘符下并解压，内置groovy，不需要安装，只需要配置环境变量就能用（2）设置环境变量： ...

2016-01-03 00:01
浏览 805
评论(0)
分类:行业应用

项目中自己的体会

博客分类：

软件思想&演讲

1.不管什么项目，多发表看法，有机会就发表意见，多交流 2.时时要保持激情的投入状态，保持着较高的效率 3.要学会处理人人的关系：请人吃饭，吃东东，拉近关系 4.有想法要找领导沟通 5.多学一些，新知识，新技能，开� ...

2016-01-02 00:31
浏览 467
评论(0)
分类:行业应用

Intellj IDEA +SBT + Scala + Spark Sql读取HDFS数据

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

spark

前提Spark集群已经搭建完毕,如果不知道怎么搭建，请参考这个链接： http://qindongliang.iteye.com/blog/2224797 注意提交作业，需要使用sbt打包成一个jar，然后在主任务里面添加jar包的路径远程提交即可，无须到远程集群上执行测试，本次测试使用的是Spark的Standalone方式 sbt依赖如下： Java代码 name := "spark-hello" version := "1.0" scalaVersion := "2.11.7&qu ...

2016-01-02 00:30
浏览 637
评论(0)
分类:行业应用

Spark简介

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

Spark简介

Spark简介 Spark是加州大学伯克利分校AMP实验室（Algorithms, Machines, and People Lab）开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目，8个月后成为Apache顶级项目，速度之快足见过人之处，Spark以其先进的设计理念，迅速成为社区的热门项目，围绕着Spark推出了Spark SQL、Spark Streaming、MLLib和GraphX等组件，也就是BDAS（伯克利数据分析栈），这些组件逐渐形成大数据处理一站式解决平台。从各方面报道来看Spark抱负并非池鱼，而是希望替代Hadoop在大数据中的地位，成为大 ...

2016-01-02 00:30
浏览 512
评论(0)
分类:编程语言

spark的安装

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

spark

1，要求你已经成功把Hadoop集群安装完毕，并经过测试，如果不知道如何编译安装Hadoop请参考散仙的这篇文章http://qindongliang.iteye.com/blog/2222145 2，安装Scala2.10.x版本，spark1.4.0最新版本的兼容2.10.x的scala，建议还是安装scala2.10.x的，虽然scala最新的版本是2.11.x了安装方法：（1） wget http://downloads.typesafe.com/scala/2.10.4/scala2.10.5.tgz_ga=1.83310549.215870088.1434449855 （2）t ...

2016-01-02 00:29
浏览 729
评论(0)
分类:行业应用

spark

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

hadoop spark

环境: Hadoop版本：Apache Hadoop2.7.1 Spark版本：Apache Spark1.4.1 核心代码：测试数据： Java代码 a,b,a c,d,f a,b,h,p,z a,f,o a,b,a c,d,f a,b,h,p,z a,f,o 在命令行使用sbt打包：sbt clean package 上传jar至Hadoop或者Spark� ...

2016-01-01 21:50
浏览 374
评论(0)
分类:行业应用

SSH无密码验证的原理

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

hadoop

配置SSH无登陆验证，在很多场景下是非常方便的，尤其是在管理大型集群服务时，避免了繁琐的密码验证，在安全级别越高的服务器上，通常密码的设置更复杂，配置SSH，不仅可以用密钥保证节点间通信的安全性，同时也降低� ...

2016-01-01 20:33
浏览 556
评论(0)
分类:企业架构

hadoop日志系统中的日志收集模块

博客分类：

hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie

hadoop

hadoop日志系统中的日志收集模块，在如今比较流行的以及开源具有代表性的有facebook的scribe，apache的chukwa，linkedin的kafka，以及非常优秀的cloudrea的flume，在1.x的hadoop生态系统中，flume比较适合做日志收集模块，因为其功能全 ...

2016-01-01 20:32
浏览 962
评论(0)
分类:企业架构

java内部类详解

博客分类：

java/guava/python/php/ruby/R/scala/groovy

java

内部类详解 1、定义一个类的定义放在另一个类的内部，这个类就叫做内部类。 Java代码复制代码收藏代码 1.public class First { 2.public class Contents{ 3. public void f(){ 4. System.out.println("In Class First's inner Class Contents method f()"); 5. } 6.} 7. } 像这样的，Contents就叫做内部类内部类了解外围类，并能与之通信(后面详细讲) ...

2016-01-01 20:32
浏览 505
评论(0)
分类:编程语言

eclipse的使用

博客分类：

工具

eclipse

eclipse的快捷键 Ctrl + Shift + X 将小写改为大写。 Ctrl + Shift + Y 将大写改为小写。

2015-12-31 12:01
浏览 465
评论(0)
分类:行业应用

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

maven POM.xml 标签详解

Zookeeper是分布式环境下一个重要的组件

Zookeeper的Session

zookeeper的一系列基础知识

Zookeeper最早是Hadoop的一个子项目

Gradle是一款非常简洁的项目构建工具

项目中自己的体会

Intellj IDEA +SBT + Scala + Spark Sql读取HDFS数据

Spark简介

spark的安装

spark

SSH无密码验证的原理

hadoop日志系统中的日志收集模块

java内部类详解

eclipse的使用

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>