`
samuschen
  • 浏览: 405971 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

TPC-H on Hive

    博客分类:
  • hive
阅读更多

1)下载TPC-H的代码,用来生成所需要的数据
  http://www.tpc.org/tpch/spec/tpch_2_8_0.zip 或者
  http://www.tpc.org/tpch/default.asp         右边栏
  两版本略有不同


4)然后在tpch文件目录下,把makefile复制并改名成makefile,接着修改makefile文件
  shell> cp makefile.suite makefile
  shell> vim makefile
  makefile中相应项后面填写:
  CC      = gcc 

 # Current values for DATABASE are: INFORMIX, DB2, TDAT (Teradata)  

 #                                  SQLSERVER, SYBASE  

 # Current values for MACHINE are:  ATT, DOS, HP, IBM, ICL, MVS, 

 #                                  SGI, SUN, U2200, VMS, LINUX, WIN32   

 # Current values for WORKLOAD are:  TPCH 

 DATABASE= SQLSERVER  

MACHINE = LINUX  

WORKLOAD = TPCH       

5)修改tpch.h文件
  修改其中的SQLSERVER段为:
  #ifdef  SQLSERVER
  #define GEN_QUERY_PLAN        "EXPLAIN;"
  #define START_TRAN                "START TRANSACTION;\n"
  #define END_TRAN                "COMMIT;\n"
  #define SET_OUTPUT                ""
  #define SET_ROWCOUNT                "limit %d;\n"
  #define SET_DBASE                "use %s;\n"
  #endif

6)执行makefile
  shell> make

7)生成需要用的数据
  shell> ./dbgen -s 1
  -s 数据规模因子,1为1G的数据量

8)在hive上建好八个表(这里有自带的脚本tpc-h/dss.ddl,将其按照hive的语法修改到dss.ddl.hive脚本)

运行  hive -f /home/cq/tpc-h/dss.ddl.hive

建好8个表

9)将生成的数据导入表中

hive>LOAD DATA LOCAL INPATH '/home/cq/tpc-h/data/supplier.tbl' INTO TABLE supplier ;

10)执行查询

  hive -f q1.sql;

 

分享到:
评论
1 楼 moudaen 2012-03-13  
请问楼主,我执行总后一条语句时,执行的是自带的1.sql,你当时修改了查询脚本吗?能否贴一个出来,谢谢!

相关推荐

    TPC-H_on_Hive_2009-08-14.tar.gz

    TPC-H_on_Hive_2009-08-14.tar.gz 是一个压缩包文件,其中包含了针对Hive的TPC-H测试工具。TPC-H是一个标准的决策支持系统(OLAP Online Analytical Processing)基准测试,主要用于评估大数据分析平台在处理复杂...

    TPC-H.zip_QUERY matlab TPC_TPC Benchmark H_TPC-H_TPC-H中文版_tpc-h

    TPC-H基准测试是信息技术行业中一个重要的性能评估标准,尤其在大数据分析和企业级数据库系统领域。这个基准是由事务处理性能委员会(Transaction Processing Performance Council,简称TPC)制定的,目的是衡量系统...

    tpc-h-tool.zip

    《TPC-H工具详解及其在数据库测试中的应用》 TPC-H工具,作为一个业界广泛使用的基准测试套件,主要用于衡量数据库系统在处理复杂的商务智能(BI)查询时的性能。这个工具包,"tpc-h-tool.zip",包含了TPC-H的最新...

    TPC-H-TOOLS

    因此,TPC-H-TOOLS可以帮助开发人员和测试工程师在Hive 2 LLAP环境中创建大量数据,以便进行性能基准测试和优化工作。 【标签】"TPCH 安装包",说明这个压缩包包含的是TPC-H相关的安装程序或配置文件,用户可以通过...

    TPC-H-Tools 2.18.0_rc2

    TPC-H是一个标准的基准测试套件,用于评估大数据仓库和联机分析处理(OLAP)系统的性能。这个测试集由交易处理性能委员会(TPC)制定,旨在模拟实际业务环境中的复杂查询。"TPC-H-Tools 2.18.0_rc2"是该测试工具的...

    HammerDB测试TPC-H

    ### HammerDB 测试 TPC-H 知识点详解 #### 一、TPC-H 概述 TPC-H (Transaction Processing Performance Council - Benchmark H) 是一个由 TPC(Transaction Processing Performance Council)制定的标准基准测试,...

    TPC-H生成的数据集

    TPC-H是一个标准的决策支持系统(OLAP)基准测试套件,用于衡量数据库管理系统在处理复杂查询和大数据量时的性能。这个数据集的生成是针对商业智能和数据分析领域,目的是评估各种数据库解决方案在实际业务场景中的...

    TPC-H_Tools_v2.18.0.zip

    TPC-H工具包 针对数据库不同的使用场景TPC组织发布了多项测试标准。 TPC-H是决策支持的基准测试。它由一套面向业务的即席查询和并发数据修改组成。 这些查询和填充数据库的数据具有广泛的行业相关性。 该基准测试...

    TPC-H_Tools_2.18.0_rc2_mysql.zip

    TPC-H是一个标准的决策支持系统基准测试套件,它由Transaction Processing Performance Council(TPC)制定,用于评估大数据分析性能。此压缩包"TPC-H_Tools_2.18.0_rc2_mysql.zip"包含了运行TPC-H测试所需的所有...

    TPC-H 2.18.0

    TPC-H工具包 针对数据库不同的使用场景TPC组织发布了多项测试标准。 TPC-H是决策支持的基准测试。它由一套面向业务的即席查询和并发数据修改组成。 这些查询和填充数据库的数据具有广泛的行业相关性。

    TPC-H 2.17.3

    TPC-H是数据库性能基准测试领域的一个重要标准,由Transaction Processing Performance Council(TPC)制定。这个测试主要用于衡量大数据环境下的决策支持系统(Decision Support Systems, DSS)的性能。2.17.3版本...

    TPC-H_Tools_v2.18.0

    TPC-H_Tools_v2.18.0 是一套针对大数据处理性能基准测试的工具集,主要用于衡量数据库管理系统(DBMS)在复杂商务智能(BI)查询上的性能。该工具基于TPC-H标准,这是一个广泛认可的业界基准,用于评估在大数据量下...

    TPCDS测试-99条Hive基准测试流程

    Hive作为Apache Hadoop生态系统中的一个数据仓库工具,经常被用于处理大规模的数据分析任务。本篇文章将详细介绍如何进行TPCDS在Hive上的基准测试流程,以及相关的技术要点。 **一、TPCDS简介** TPCDS是一个决策...

    TPC-DS tools压测工具源码下载TPC-DS_Tools_v3.2.0.zip

    5. **性能测试**:DSGen生成的数据集可以配合其他工具(如Apache Hive、Impala或Spark SQL)执行TPC-DS的查询集,这些查询涵盖了各种复杂的SQL操作,以全面评估系统的查询性能、并发处理能力和稳定性。 6. **结果...

    TPC_H_TOOLS工具包

    TPC-H(商业智能计算测试) 是美国交易处理效能委员会(TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集.目前,在学术界和工业界普遍采用它来评价决策支持技术方面...

    大数据平台测试数据生产-使用TPC-H生成测试数据

    TPC-H(商业智能计算测试)是TPC的重要测试标准之一,主要用来模拟真实商业的应用环境。 TPC-H 用 3NF 实现了一个数据仓库,共包含 8 个基本关系/表,其中表REGION和表NATION的记录数是固定的(分别为5和25),其它6个表...

    TPCH.zip_SQL reference_TPC-H_tpc_tpch_tpch.pdf

    《TPC-H.zip:SQL参考与TPC-H测试基准详解》 TPC-H是一个广泛用于评估数据库管理系统(DBMS)在复杂商务智能查询性能上的标准测试基准。此压缩包“TPCH.zip”包含了关于TPC-H的重要参考资料,特别是对于那些在SQL...

    TPC-DS_Tools_v3.2.0.zip

    【标题】"TPC-DS_Tools_v3.2.0.zip" 提供的是一个针对 TP C-DS(Transaction Processing Performance Council Decision Support)的工具集,版本为3.2.0。TPC-DS 是一种标准的性能基准测试套件,用于衡量大数据分析...

    tpc-h-0.1GB.tar.gz

    《TPC-H 0.1GB 数据集:深入解析与应用》 TPC-H 是一个广泛使用的商业智能(BI)和数据仓库基准测试套件,它由 Transaction Processing Performance Council(TPC)制定,用于评估大数据分析系统的性能。在这个场景...

Global site tag (gtag.js) - Google Analytics