Spark读取Hbase数据

qindongliang1922

浏览: 2203489 次
性别:
来自: 北京

最近访客更多访客>>

北风norther

godandghost

youhere

tanss

博主相关

博客

微博

相册

留言

关于我

博客专栏

: 证道Lucene4
浏览量：118145

: 证道Hadoop
浏览量：126517

: 证道shell编程
浏览量：60516

: ELK修真
浏览量：71773

文章分类

社区版块

存档分类

博客分类：

Hbase
Spark

hbase spark

直接上代码：可以上传jar包，给远程的spark集群，这样能在idea中windows环境上运行代码：


package com.tools.hbase

import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.hadoop.hbase.client.Result
import org.apache.hadoop.hbase.io.ImmutableBytesWritable
import org.apache.hadoop.hbase.mapreduce.TableInputFormat
import org.apache.spark.{SparkContext, SparkConf}

/**
  * Created by qindongliang on 2016/1/12.
  */
object HbaseTest {


  def main(args: Array[String]) {
    System.setProperty("user.name", "webmaster");
        System.setProperty("HADOOP_USER_NAME", "webmaster");
    val jarPath="target\\scala-2.11\\scala-spark_2.11-1.0.jar";
    val  sparkConf=new SparkConf().setMaster("spark://192.168.1.187:7077").setAppName("read hbase");
     val seq=Seq(jarPath) :+ "D:\\bigdata\\hbaselib\\hbase-protocol-0.98.12-hadoop2.jar" :+ "D:\\bigdata\\hbaselib\\hbase-common-0.98.12-hadoop2.jar" :+ "D:\\bigdata\\hbaselib\\htrace-core-2.04.jar" :+ "D:\\bigdata\\hbaselib\\hbase-client-0.98.12-hadoop2.jar" :+ "D:\\bigdata\\hbaselib\\hbase-server-0.98.12-hadoop2.jar"  :+ "D:\\bigdata\\hbaselib\\guava-12.0.1.jar"
//     val seq=Seq(jarPath)
//    println("jar包路径："+seq)

    sparkConf.setJars(seq)
    val sc=new SparkContext(sparkConf);
    val conf=HBaseConfiguration.create();
    conf.set("hbase.zookeeper.quorum", "192.168.1.187");
    conf.set(TableInputFormat.INPUT_TABLE,"xxxx")
    //得到Hbase的Result转成RDD
    val rdd=sc.newAPIHadoopRDD(conf,classOf[TableInputFormat]
    ,classOf[ImmutableBytesWritable],classOf[Result]);

    val count=rdd.count();
    println("数量："+count)
    sc.stop();


  }


}

分享到：

你不知道的Java的split的小问题 | Spark SQL+Hive历险记

2016-01-21 15:39
浏览 2617
评论(0)
论坛回复 / 浏览 (0 / 2311)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

Spark读取Hbase数据

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

Spark读取Hbase数据

评论

发表评论

相关推荐

关于Hbase多版本存储的一个注意点

Scala里面的排序函数的使用

在Scala里面如何使用元组

Spark如何读取一些大数据集到本地机器上

使用Spark SQL的临时表解决一个小问题

Spark任务两个小问题笔记

Spark中foreachPartition和mapPartitions的区别

Spark Streaming优雅的关闭策略优化

kafka版本不一致导致的一个小问题（二）

谈谈如何优雅的关闭正在运行中的Spark Streaming的流程序

如何管理Spark Streaming消费Kafka的偏移量（三）

理解Spark的运行机制

如何管理Spark Streaming消费Kafka的偏移量（二）

如何管理Spark Streaming消费Kafka的偏移量（一）

在scala中使用spark sql解决特定需求（2）

在scala中使用spark sql解决特定需求

Spark如何在一个SparkContext中提交多个任务

Spark如何读取Hbase特定查询的数据

如何使用scala+spark读写hbase？

使用ES-Hadoop插件结合spark向es插入数据

最近访客更多访客>>