`
阅读更多

TPC-H是数据库/数据仓库选型决策用的benchmark。它是世界公认的benchmark,由一套面向业务的数据查询和并发数据更新组成。百度文库里有个文档写的还不错。

 

Jia, Yuntao在HIVE-600中提交了TPC-H的hive driver。Driver由shell脚本作为bootstrap,由一系列HQL文件组成,总共22个benchmark。Driver中并不包含原始数据,需要使用TPC-H的DBGEN生成。

分享到:
评论

相关推荐

    TPC-H_on_Hive_2009-08-14.tar.gz

    TPC-H_on_Hive_2009-08-14.tar.gz 是一个压缩包文件,其中包含了针对Hive的TPC-H测试工具。TPC-H是一个标准的决策支持系统(OLAP Online Analytical Processing)基准测试,主要用于评估大数据分析平台在处理复杂...

    SQL-on-Hadoop: Full Circle Back to Shared-Nothing Database Architectures

    - **总体性能**:在TPC-H实验中,Impala比基于MapReduce的Hive快3.3倍至4.4倍,比基于Tez的Hive快2.1倍至2.8倍。 - **TPC-DS启发的实验**:对于这些实验,Impala表现出更明显的性能优势,比基于MapReduce的Hive快...

    TPCDS-Hive-On-Spark:在 Spark 上准备运行的 TPCDS 查询

    This Scala source allowsyou run 38 out of the 99 TPCDS queries (The Hive version supported by Spark SQL in the current release of IBM Open Platform available athttp://g01zcdwas002.ahe.pok.ibm....

    基于SQL-on-Hadoop查询引擎的日志挖掘及其应用.pdf

    使用TPC-H测试基准对SQL-on-Hadoop查询系统的决策支持能力进行了测试及评估。通过对实验数据的分析与解释,得到了一些关于系统性能的重要结论。 6. 日志数据计算与分析在证券行业的应用: 文章探讨了海量日志数据...

    译文 Blink and it's done1

    通过 **TPC-H** 测试和实际数据验证,BlinkDB 显示出显著的性能提升。在100台机器上处理数十TB的数据,其运行速度相对于 **Hive on MapReduce** 可以快150倍,比 **Shark** 快10到150倍,同时保持误差在2%到10%之间...

Global site tag (gtag.js) - Google Analytics