`
guoyunsky
  • 浏览: 854130 次
  • 性别: Icon_minigender_1
  • 来自: 上海
博客专栏
3d3a22a0-f00f-3227-8d03-d2bbe672af75
Heritrix源码分析
浏览量:206217
Group-logo
SQL的MapReduce...
浏览量:0
社区版块
存档分类
最新评论

Apache Tajo介绍

 
阅读更多

       微博:http://weibo.com/guoyunwb

 

       Apache Tajo已经进入apache孵化器,国内网上一搜貌似还没有相关资料。这里我就抛砖引玉,充当一点翻译工作。

 

       介绍:

       Apache Tajo是一个基于hadoop的关系型且分布式的数据库仓库系统,Tajo设计之初就是通过先进的数据库技术做到能够低延迟,可扩展,即时查询,可聚合的数据库仓库系统,以弥补hadoop等目前在实时,关系事务方面的短板。同时Tajo还支持SQL标准,所以你可以通过SQL来操作它。HDFS为Tajo的主要存储层,并且有自己的查询引擎(代码结构看下来貌似很多代码都是自己写的)所以可以直接控制各种分布式执行(如查询)和数据流。如此Tajo有许多查询控制策略,以及对查询可以做很多优化。

 

       功能:

       1.快速且低延迟的查询,支持各种SQL操作,如条件查询,GROUP BY,SORT,JOIN等

       2.自身支持ETL

       3.支持各种数据格式,如CSV, RCFile, RowFile (基于行的文件存储), and Trevni

         4.有自己的命令行接口,所以可以直接通过SQL去操作Tajo

         5.也可以直接通过Java Client去操作Tajo

 

        依赖:

  • Hadoop 2.0.3-alpha
  • Java 1.6

         网址:

             http://tajo.incubator.apache.org/

 

 更多技术文章、感悟、分享、勾搭,请用微信扫描:

0
5
分享到:
评论
1 楼 yangfuchao418 2013-08-29  
这东西有点类型google,F1数据库。估计也是模仿这个的

相关推荐

    tajo-proxy:Tajo代理

    - 版本信息:这个版本号表明了Tajo代理的特定发行版,0.9.1是Tajo项目的版本,而CDH5.2.0是Cloudera Distribution Including Apache Hadoop (CDH)的一个版本,包含了对Tajo的支持。 - 兼容性:CDH5.2.0通常意味着...

    python-tajo-client

    Python Tajo 客户端是用于与Apache Tajo数据处理系统交互的一种工具,它允许开发者通过Python编程语言来执行查询、管理数据以及进行其他相关的操作。Tajo是一个分布式、低延迟的数据处理系统,设计用于大规模的数据...

    TadpoleForDB工具

    Tadpole DB Hub是统一基础架构工具,是基于各种环境的界面,用于管理Altibase,Apache Hive,Apache Tajo,Amzaon DynamoDB,Amazon RDS,Amazon Redshift,Elasticsearch,MySQL,MariaDB,Oracle,SQLite,Tibero...

    Tadpole DB Hub:基于Web的数据库协作工具-开源

    原始主页:https://github.com/hangum/TadpoleForDBTools它是管理Altibase,Amazon RDS,Apache Hive,Apache Cassandra,Apache Tajo,MongoDB,CUBRID,MariaDB,MySQL,Oracle,MSSQL,SQLite,Tibero, Web...

    大数据平台技术框架选型分析.pdf

    相关资料中提到了多个开源工具,如 Presto、Phoenix、Stinger、Shark、Pig、Cloudera Impala、Apache Drill 和 Apache Tajo,这些工具在大数据查询和处理方面各有特色,可以根据具体业务需求进行选择。 综上所述,...

    主流开源SQL引擎分析.docx

    本篇文章将探讨几个主流的开源SQL引擎,包括Hive、Impala、Spark SQL、Drill、HAWQ和Presto,以及Calcite、Kylin、Phoenix、Tajo和Trafodion等。此外,也会提及两个商业化产品——Oracle Big Data SQL和IBM Big SQL...

    大数据平台技术框架选型资料.pdf

    最后,相关资料如Presto、Stinger、Phoenix等查询引擎,以及Shark、Pig、Cloudera Impala、Apache Drill和Tajo等工具,这些都是大数据分析领域的关键组件,可以根据实际需求和平台兼容性进行选择。 总的来说,...

    通用大数据存储和分析处理平台-Hadoop.pdf

    Hadoop是一个开源的分布式计算框架,由Apache基金会开发,旨在处理和存储大规模数据。最初设计目的是为了构建搜索引擎的网页索引,但随着时间的发展,Hadoop已经成为大数据处理领域的重要工具,广泛应用于数据存储、...

    通用大数据存储和分析处理平台-Hadoop.docx

    它由Apache基金会开发,旨在提供可靠、可扩展的数据处理解决方案。Hadoop的核心组件包括Hadoop Distributed File System (HDFS) 和 MapReduce。 1. **HDFS(Hadoop Distributed File System)**: - **概述**:...

    大数据图标大全.docx

    43. **Tajo**: 在Hadoop上的大数据仓库系统,支持SQL查询和复杂分析。 44. **Trafodion**: 事务处理SQL-on-Hadoop数据库,为企业级应用提供ACID特性。 45. **Phoenix**: 提供对HBase的SQL接口,支持OLTP和操作型...

Global site tag (gtag.js) - Google Analytics