1)下载TPC-H的代码,用来生成所需要的数据
http://www.tpc.org/tpch/spec/tpch_2_8_0.zip
或者
http://www.tpc.org/tpch/default.asp
右边栏
两版本略有不同
4)然后在tpch文件目录下,把makefile复制并改名成makefile,接着修改makefile文件
shell> cp makefile.suite makefile
shell> vim makefile
makefile中相应项后面填写:
CC = gcc
# Current values for DATABASE are: INFORMIX, DB2, TDAT
(Teradata)
# SQLSERVER, SYBASE
#
Current values for MACHINE are: ATT, DOS, HP, IBM, ICL, MVS,
#
SGI, SUN, U2200, VMS, LINUX, WIN32
#
Current values for WORKLOAD are: TPCH
DATABASE= SQLSERVER
MACHINE =
LINUX
WORKLOAD = TPCH
5)修改tpch.h文件
修改其中的SQLSERVER段为:
#ifdef SQLSERVER
#define GEN_QUERY_PLAN "EXPLAIN;"
#define START_TRAN "START TRANSACTION;\n"
#define END_TRAN "COMMIT;\n"
#define SET_OUTPUT ""
#define SET_ROWCOUNT "limit %d;\n"
#define SET_DBASE "use %s;\n"
#endif
6)执行makefile
shell> make
7)生成需要用的数据
shell> ./dbgen -s 1
-s 数据规模因子,1为1G的数据量
8)在hive上建好八个表(这里有自带的脚本tpc-h/dss.ddl,将其按照hive的语法修改到dss.ddl.hive脚本)
运行 hive -f /home/cq/tpc-h/dss.ddl.hive
建好8个表
9)将生成的数据导入表中
hive>LOAD DATA LOCAL INPATH '/home/cq/tpc-h/data/supplier.tbl' INTO TABLE supplier ;
10)执行查询
hive -f q1.sql;
分享到:
相关推荐
TPC-H_on_Hive_2009-08-14.tar.gz 是一个压缩包文件,其中包含了针对Hive的TPC-H测试工具。TPC-H是一个标准的决策支持系统(OLAP Online Analytical Processing)基准测试,主要用于评估大数据分析平台在处理复杂...
TPC-H基准测试是信息技术行业中一个重要的性能评估标准,尤其在大数据分析和企业级数据库系统领域。这个基准是由事务处理性能委员会(Transaction Processing Performance Council,简称TPC)制定的,目的是衡量系统...
《TPC-H工具详解及其在数据库测试中的应用》 TPC-H工具,作为一个业界广泛使用的基准测试套件,主要用于衡量数据库系统在处理复杂的商务智能(BI)查询时的性能。这个工具包,"tpc-h-tool.zip",包含了TPC-H的最新...
因此,TPC-H-TOOLS可以帮助开发人员和测试工程师在Hive 2 LLAP环境中创建大量数据,以便进行性能基准测试和优化工作。 【标签】"TPCH 安装包",说明这个压缩包包含的是TPC-H相关的安装程序或配置文件,用户可以通过...
TPC-H是一个标准的基准测试套件,用于评估大数据仓库和联机分析处理(OLAP)系统的性能。这个测试集由交易处理性能委员会(TPC)制定,旨在模拟实际业务环境中的复杂查询。"TPC-H-Tools 2.18.0_rc2"是该测试工具的...
### HammerDB 测试 TPC-H 知识点详解 #### 一、TPC-H 概述 TPC-H (Transaction Processing Performance Council - Benchmark H) 是一个由 TPC(Transaction Processing Performance Council)制定的标准基准测试,...
TPC-H是一个标准的决策支持系统(OLAP)基准测试套件,用于衡量数据库管理系统在处理复杂查询和大数据量时的性能。这个数据集的生成是针对商业智能和数据分析领域,目的是评估各种数据库解决方案在实际业务场景中的...
TPC-H工具包 针对数据库不同的使用场景TPC组织发布了多项测试标准。 TPC-H是决策支持的基准测试。它由一套面向业务的即席查询和并发数据修改组成。 这些查询和填充数据库的数据具有广泛的行业相关性。 该基准测试...
TPC-H是一个标准的决策支持系统基准测试套件,它由Transaction Processing Performance Council(TPC)制定,用于评估大数据分析性能。此压缩包"TPC-H_Tools_2.18.0_rc2_mysql.zip"包含了运行TPC-H测试所需的所有...
TPC-H工具包 针对数据库不同的使用场景TPC组织发布了多项测试标准。 TPC-H是决策支持的基准测试。它由一套面向业务的即席查询和并发数据修改组成。 这些查询和填充数据库的数据具有广泛的行业相关性。
TPC-H是数据库性能基准测试领域的一个重要标准,由Transaction Processing Performance Council(TPC)制定。这个测试主要用于衡量大数据环境下的决策支持系统(Decision Support Systems, DSS)的性能。2.17.3版本...
TPC-H_Tools_v2.18.0 是一套针对大数据处理性能基准测试的工具集,主要用于衡量数据库管理系统(DBMS)在复杂商务智能(BI)查询上的性能。该工具基于TPC-H标准,这是一个广泛认可的业界基准,用于评估在大数据量下...
Hive作为Apache Hadoop生态系统中的一个数据仓库工具,经常被用于处理大规模的数据分析任务。本篇文章将详细介绍如何进行TPCDS在Hive上的基准测试流程,以及相关的技术要点。 **一、TPCDS简介** TPCDS是一个决策...
5. **性能测试**:DSGen生成的数据集可以配合其他工具(如Apache Hive、Impala或Spark SQL)执行TPC-DS的查询集,这些查询涵盖了各种复杂的SQL操作,以全面评估系统的查询性能、并发处理能力和稳定性。 6. **结果...
TPC-H(商业智能计算测试) 是美国交易处理效能委员会(TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集.目前,在学术界和工业界普遍采用它来评价决策支持技术方面...
TPC-H(商业智能计算测试)是TPC的重要测试标准之一,主要用来模拟真实商业的应用环境。 TPC-H 用 3NF 实现了一个数据仓库,共包含 8 个基本关系/表,其中表REGION和表NATION的记录数是固定的(分别为5和25),其它6个表...
《TPC-H.zip:SQL参考与TPC-H测试基准详解》 TPC-H是一个广泛用于评估数据库管理系统(DBMS)在复杂商务智能查询性能上的标准测试基准。此压缩包“TPCH.zip”包含了关于TPC-H的重要参考资料,特别是对于那些在SQL...
【标题】"TPC-DS_Tools_v3.2.0.zip" 提供的是一个针对 TP C-DS(Transaction Processing Performance Council Decision Support)的工具集,版本为3.2.0。TPC-DS 是一种标准的性能基准测试套件,用于衡量大数据分析...
《TPC-H 0.1GB 数据集:深入解析与应用》 TPC-H 是一个广泛使用的商业智能(BI)和数据仓库基准测试套件,它由 Transaction Processing Performance Council(TPC)制定,用于评估大数据分析系统的性能。在这个场景...