`
samuschen
  • 浏览: 407557 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

TPC-H on Hive

    博客分类:
  • hive
阅读更多

1)下载TPC-H的代码,用来生成所需要的数据
  http://www.tpc.org/tpch/spec/tpch_2_8_0.zip 或者
  http://www.tpc.org/tpch/default.asp         右边栏
  两版本略有不同


4)然后在tpch文件目录下,把makefile复制并改名成makefile,接着修改makefile文件
  shell> cp makefile.suite makefile
  shell> vim makefile
  makefile中相应项后面填写:
  CC      = gcc 

 # Current values for DATABASE are: INFORMIX, DB2, TDAT (Teradata)  

 #                                  SQLSERVER, SYBASE  

 # Current values for MACHINE are:  ATT, DOS, HP, IBM, ICL, MVS, 

 #                                  SGI, SUN, U2200, VMS, LINUX, WIN32   

 # Current values for WORKLOAD are:  TPCH 

 DATABASE= SQLSERVER  

MACHINE = LINUX  

WORKLOAD = TPCH       

5)修改tpch.h文件
  修改其中的SQLSERVER段为:
  #ifdef  SQLSERVER
  #define GEN_QUERY_PLAN        "EXPLAIN;"
  #define START_TRAN                "START TRANSACTION;\n"
  #define END_TRAN                "COMMIT;\n"
  #define SET_OUTPUT                ""
  #define SET_ROWCOUNT                "limit %d;\n"
  #define SET_DBASE                "use %s;\n"
  #endif

6)执行makefile
  shell> make

7)生成需要用的数据
  shell> ./dbgen -s 1
  -s 数据规模因子,1为1G的数据量

8)在hive上建好八个表(这里有自带的脚本tpc-h/dss.ddl,将其按照hive的语法修改到dss.ddl.hive脚本)

运行  hive -f /home/cq/tpc-h/dss.ddl.hive

建好8个表

9)将生成的数据导入表中

hive>LOAD DATA LOCAL INPATH '/home/cq/tpc-h/data/supplier.tbl' INTO TABLE supplier ;

10)执行查询

  hive -f q1.sql;

 

分享到:
评论
1 楼 moudaen 2012-03-13  
请问楼主,我执行总后一条语句时,执行的是自带的1.sql,你当时修改了查询脚本吗?能否贴一个出来,谢谢!

相关推荐

    TPC-H_on_Hive_2009-08-14.tar.gz

    TPC-H_on_Hive_2009-08-14.tar.gz 是一个压缩包文件,其中包含了针对Hive的TPC-H测试工具。TPC-H是一个标准的决策支持系统(OLAP Online Analytical Processing)基准测试,主要用于评估大数据分析平台在处理复杂...

    TPC-H.zip_QUERY matlab TPC_TPC Benchmark H_TPC-H_TPC-H中文版_tpc-h

    TPC-H基准测试是信息技术行业中一个重要的性能评估标准,尤其在大数据分析和企业级数据库系统领域。这个基准是由事务处理性能委员会(Transaction Processing Performance Council,简称TPC)制定的,目的是衡量系统...

    tpc-h-tool.zip

    《TPC-H工具详解及其在数据库测试中的应用》 TPC-H工具,作为一个业界广泛使用的基准测试套件,主要用于衡量数据库系统在处理复杂的商务智能(BI)查询时的性能。这个工具包,"tpc-h-tool.zip",包含了TPC-H的最新...

    TPC-H-TOOLS

    因此,TPC-H-TOOLS可以帮助开发人员和测试工程师在Hive 2 LLAP环境中创建大量数据,以便进行性能基准测试和优化工作。 【标签】"TPCH 安装包",说明这个压缩包包含的是TPC-H相关的安装程序或配置文件,用户可以通过...

    TPC-H-Tools 2.18.0_rc2

    TPC-H是一个标准的基准测试套件,用于评估大数据仓库和联机分析处理(OLAP)系统的性能。这个测试集由交易处理性能委员会(TPC)制定,旨在模拟实际业务环境中的复杂查询。"TPC-H-Tools 2.18.0_rc2"是该测试工具的...

    HammerDB测试TPC-H

    ### HammerDB 测试 TPC-H 知识点详解 #### 一、TPC-H 概述 TPC-H (Transaction Processing Performance Council - Benchmark H) 是一个由 TPC(Transaction Processing Performance Council)制定的标准基准测试,...

    TPC-H生成的数据集

    TPC-H是一个标准的决策支持系统(OLAP)基准测试套件,用于衡量数据库管理系统在处理复杂查询和大数据量时的性能。这个数据集的生成是针对商业智能和数据分析领域,目的是评估各种数据库解决方案在实际业务场景中的...

    TPC-H_Tools_v2.18.0.zip

    TPC-H工具包 针对数据库不同的使用场景TPC组织发布了多项测试标准。 TPC-H是决策支持的基准测试。它由一套面向业务的即席查询和并发数据修改组成。 这些查询和填充数据库的数据具有广泛的行业相关性。 该基准测试...

    TPC-H_Tools_2.18.0_rc2_mysql.zip

    TPC-H是一个标准的决策支持系统基准测试套件,它由Transaction Processing Performance Council(TPC)制定,用于评估大数据分析性能。此压缩包"TPC-H_Tools_2.18.0_rc2_mysql.zip"包含了运行TPC-H测试所需的所有...

    TPC-H 2.18.0

    TPC-H工具包 针对数据库不同的使用场景TPC组织发布了多项测试标准。 TPC-H是决策支持的基准测试。它由一套面向业务的即席查询和并发数据修改组成。 这些查询和填充数据库的数据具有广泛的行业相关性。

    TPC-H 2.17.3

    TPC-H是数据库性能基准测试领域的一个重要标准,由Transaction Processing Performance Council(TPC)制定。这个测试主要用于衡量大数据环境下的决策支持系统(Decision Support Systems, DSS)的性能。2.17.3版本...

    TPC-H V 3.0.1

    TPC-H是由Transaction Processing Performance Council (TPC) 开发的一个广泛认可的基准测试套件,专用于评估数据仓库和企业级数据库系统在执行复杂查询和商业数据分析时的性能。这个基准测试是为了模拟真实世界中...

    TPC-H_Tools_v2.18.0

    TPC-H_Tools_v2.18.0 是一套针对大数据处理性能基准测试的工具集,主要用于衡量数据库管理系统(DBMS)在复杂商务智能(BI)查询上的性能。该工具基于TPC-H标准,这是一个广泛认可的业界基准,用于评估在大数据量下...

    TPCDS测试-99条Hive基准测试流程

    Hive作为Apache Hadoop生态系统中的一个数据仓库工具,经常被用于处理大规模的数据分析任务。本篇文章将详细介绍如何进行TPCDS在Hive上的基准测试流程,以及相关的技术要点。 **一、TPCDS简介** TPCDS是一个决策...

    TPC-DS tools压测工具源码下载TPC-DS_Tools_v3.2.0.zip

    5. **性能测试**:DSGen生成的数据集可以配合其他工具(如Apache Hive、Impala或Spark SQL)执行TPC-DS的查询集,这些查询涵盖了各种复杂的SQL操作,以全面评估系统的查询性能、并发处理能力和稳定性。 6. **结果...

    TPC_H_TOOLS工具包

    TPC-H(商业智能计算测试) 是美国交易处理效能委员会(TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集.目前,在学术界和工业界普遍采用它来评价决策支持技术方面...

    大数据平台测试数据生产-使用TPC-H生成测试数据

    TPC-H(商业智能计算测试)是TPC的重要测试标准之一,主要用来模拟真实商业的应用环境。 TPC-H 用 3NF 实现了一个数据仓库,共包含 8 个基本关系/表,其中表REGION和表NATION的记录数是固定的(分别为5和25),其它6个表...

    TPCH.zip_SQL reference_TPC-H_tpc_tpch_tpch.pdf

    《TPC-H.zip:SQL参考与TPC-H测试基准详解》 TPC-H是一个广泛用于评估数据库管理系统(DBMS)在复杂商务智能查询性能上的标准测试基准。此压缩包“TPCH.zip”包含了关于TPC-H的重要参考资料,特别是对于那些在SQL...

    TPC-DS_Tools_v3.2.0.zip

    【标题】"TPC-DS_Tools_v3.2.0.zip" 提供的是一个针对 TP C-DS(Transaction Processing Performance Council Decision Support)的工具集,版本为3.2.0。TPC-DS 是一种标准的性能基准测试套件,用于衡量大数据分析...

Global site tag (gtag.js) - Google Analytics