`
chakey
  • 浏览: 365458 次
  • 性别: Icon_minigender_1
  • 来自: 水星
社区版块
存档分类
最新评论

基于Hadoop的一些工具一句话介绍

阅读更多

 

    Pig 是在MapReduce上构建的查询语言(SQL-like),适用于大量并行计算。

 

    Chukwa 是基于Hadoop集群中监控系统,可以用他来分析和收集系统中的数据(日志)

 

    Hive 是DataWareHouse 和 Map Reduce交集,适用于ETL方面的工作


    HBase 是一个面向列的分布式数据库。

 

    Map Reduce 是Google提出的一种算法,用于超大型数据集的并行运算。

 

    HDFS 可以支持千万级的大型分布式文件系统。

 

    Zookeeper  提供的功能包括:配置维护、名字服务、分布式同步、组服务等,用于分布式系统的可靠协调系统。

 

    Avro 是一个数据序列化系统,设计用于支持大批量数据交换的应用

 

    Sqoop 是一个可以将关系型数据库中的数据导入到Hadoop文件系统(HDFS)中的工具 。例如 Mysql的数据向Hive/HBase迁移。支持 Hsqldb、MySQL、Oracle、PostgreSQL等。

 http://archive.cloudera.com/cdh/3/sqoop/SqoopUserGuide.html

0
0
分享到:
评论

相关推荐

    大数据基础面试题hadoop,zookeeper,hbase,hive,spark,kafka,flink,clickhouse

    基于 Hadoop 的 HBase 是一个非关系型数据库(NoSQL),适合实时读写大规模数据。它提供了行式存储,支持列族,具有良好的水平扩展性,适用于时间序列数据或稀疏数据。 4. **Hive**: Hive 是构建在 Hadoop 上的...

    hardoop学习

    Hadoop 家族产品可以分为两类,一类是已经掌握的产品,另一类是 TODO 准备继续学习的一句话产品。下面将对每个产品进行详细的介绍: 1. Apache Hadoop:是一个分布式计算开源框架,提供了一个分布式文件系统子项目...

    大数据小型项目源码之mapreduce英语单词频次统计

    在这个项目中,Mapper会分割输入行(假设每行是一句话),提取单词并创建<单词, 1>的键值对。Reducer类的`reduce()`方法负责将相同键的值进行求和,得到单词的总频次。 5. **Hadoop配置与运行**: 运行MapReduce...

    springboot348基于大数据的智能家居销量数据分析2023_jr986.zip

    描述部分只有一句话:“springboot348基于大数据的智能家居销量数据分析2023_jr986”,这可能是指一个具体的项目或者案例研究,可能包含了2023年关于智能家居设备销售的详细数据分析。智能家居是指通过互联网连接的...

    java提取文章关键字

    在Java编程语言中,提取文章关键字是一项常见的自然语言处理任务,它涉及到文本挖掘和信息检索领域。这个任务的目的是从一篇文章中识别出最具代表性的词语或短语,这些词汇通常反映了文章的主题和核心内容。在Java中...

    scripts_造4_

    【描述】"大文件大玩家可我觉得就爱我觉得加快科技为大家" 这句话虽然语法有些不清晰,但我们可以从中提取出几个关键点。首先,“大文件大玩家”可能是指那些经常处理大量数据或大体积文件的专业人士,如数据科学家...

    我们成长的烦恼JAVA

    ”这句话在这里显得尤为贴切。 Java以其“一次编写,到处运行”的跨平台特性著称,这使得开发者能够在不同的操作系统上运行Java程序,极大地扩展了其应用范围。从Web应用程序到移动应用,再到大数据处理和云计算,...

Global site tag (gtag.js) - Google Analytics