TPC-H on Hive - - ITeye博客

`

samuschen

浏览: 411789 次
性别:
来自: 北京

最近访客更多访客>>

dy.f

u012363178

谁谁谁

wangyy

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

秦时明月黑：深入浅出，楼主很有功底
hive编译部分的源码结构
tywo45：感觉好多错误，但还是支持！
HDFS+MapReduce+Hive+HBase十分钟快速入门
xbbHistory：解析的很棒！！
Linux-VFS
darrendu：执行这个命令，bin/hadoop fs -ls /home/ ...
Hadoop示例程序WordCount运行及详解
moudaen：请问楼主，我执行总后一条语句时，执行的是自带的1.sql，你当 ...
TPC-H on Hive

TPC-H on Hive

博客分类：

hive

Linux Sybase HP vim DB2

阅读更多

1)下载TPC-H的代码，用来生成所需要的数据
  http://www.tpc.org/tpch/spec/tpch_2_8_0.zip 或者
  http://www.tpc.org/tpch/default.asp 右边栏
  两版本略有不同

4)然后在tpch文件目录下，把makefile复制并改名成makefile，接着修改makefile文件
  shell> cp makefile.suite makefile
  shell> vim makefile
  makefile中相应项后面填写：
  CC    = gcc

# Current values for DATABASE are: INFORMIX, DB2, TDAT (Teradata)

# SQLSERVER, SYBASE

# Current values for MACHINE are: ATT, DOS, HP, IBM, ICL, MVS,

# SGI, SUN, U2200, VMS, LINUX, WIN32

# Current values for WORKLOAD are: TPCH

DATABASE= SQLSERVER

MACHINE = LINUX

WORKLOAD = TPCH

5)修改tpch.h文件
  修改其中的SQLSERVER段为：
  #ifdef  SQLSERVER
  #define GEN_QUERY_PLAN "EXPLAIN;"
  #define START_TRAN "START TRANSACTION;\n"
  #define END_TRAN "COMMIT;\n"
  #define SET_OUTPUT ""
  #define SET_ROWCOUNT "limit %d;\n"
  #define SET_DBASE "use %s;\n"
  #endif

6)执行makefile
  shell> make

7)生成需要用的数据
shell> ./dbgen -s 1
-s 数据规模因子，1为1G的数据量

8)在hive上建好八个表（这里有自带的脚本tpc-h/dss.ddl,将其按照hive的语法修改到dss.ddl.hive脚本）

运行 hive -f /home/cq/tpc-h/dss.ddl.hive

建好8个表

9）将生成的数据导入表中

hive>LOAD DATA LOCAL INPATH '/home/cq/tpc-h/data/supplier.tbl' INTO TABLE supplier ;

10）执行查询

hive -f q1.sql;

dss.ddl.rar (687 Bytes)
下载次数: 53

分享到：

HDFS添加和删除节点 | hive show table显示不出表的问题

2010-12-03 17:40
浏览 4168
评论(1)
分类:企业架构
查看更多

评论

1 楼 moudaen 2012-03-13

请问楼主，我执行总后一条语句时，执行的是自带的1.sql，你当时修改了查询脚本吗？能否贴一个出来，谢谢！

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

TPC-H_on_Hive_2009-08-14.tar.gz: TPC-H_on_Hive_2009-08-14.tar.gz 是一个压缩包文件，其中包含了针对Hive的TPC-H测试工具。TPC-H是一个标准的决策支持系统（OLAP Online Analytical Processing）基准测试，主要用于评估大数据分析平台在处理复杂...

TPC-H.zip_QUERY matlab TPC_TPC Benchmark H_TPC-H_TPC-H中文版_tpc-h: TPC-H基准测试是信息技术行业中一个重要的性能评估标准，尤其在大数据分析和企业级数据库系统领域。这个基准是由事务处理性能委员会（Transaction Processing Performance Council，简称TPC）制定的，目的是衡量系统...

tpc-h-tool.zip: 《TPC-H工具详解及其在数据库测试中的应用》 TPC-H工具，作为一个业界广泛使用的基准测试套件，主要用于衡量数据库系统在处理复杂的商务智能（BI）查询时的性能。这个工具包，"tpc-h-tool.zip"，包含了TPC-H的最新...

TPC-H-TOOLS: 因此，TPC-H-TOOLS可以帮助开发人员和测试工程师在Hive 2 LLAP环境中创建大量数据，以便进行性能基准测试和优化工作。【标签】"TPCH 安装包"，说明这个压缩包包含的是TPC-H相关的安装程序或配置文件，用户可以通过...

TPC-H-Tools 2.18.0_rc2: TPC-H是一个标准的基准测试套件，用于评估大数据仓库和联机分析处理（OLAP）系统的性能。这个测试集由交易处理性能委员会（TPC）制定，旨在模拟实际业务环境中的复杂查询。"TPC-H-Tools 2.18.0_rc2"是该测试工具的...

HammerDB测试TPC-H: ### HammerDB 测试 TPC-H 知识点详解 #### 一、TPC-H 概述 TPC-H (Transaction Processing Performance Council - Benchmark H) 是一个由 TPC（Transaction Processing Performance Council）制定的标准基准测试，...

TPC-H_Tools_v2.18.0.zip: TPC-H工具包针对数据库不同的使用场景TPC组织发布了多项测试标准。 TPC-H是决策支持的基准测试。它由一套面向业务的即席查询和并发数据修改组成。这些查询和填充数据库的数据具有广泛的行业相关性。该基准测试...

TPC-H生成的数据集: TPC-H是一个标准的决策支持系统（OLAP）基准测试套件，用于衡量数据库管理系统在处理复杂查询和大数据量时的性能。这个数据集的生成是针对商业智能和数据分析领域，目的是评估各种数据库解决方案在实际业务场景中的...

TPC-H V 3.0.1: TPC-H是由Transaction Processing Performance Council (TPC) 开发的一个广泛认可的基准测试套件，专用于评估数据仓库和企业级数据库系统在执行复杂查询和商业数据分析时的性能。这个基准测试是为了模拟真实世界中...

TPC-H_Tools_2.18.0_rc2_mysql.zip: TPC-H是一个标准的决策支持系统基准测试套件，它由Transaction Processing Performance Council（TPC）制定，用于评估大数据分析性能。此压缩包"TPC-H_Tools_2.18.0_rc2_mysql.zip"包含了运行TPC-H测试所需的所有...

TPC-H 2.18.0: TPC-H工具包针对数据库不同的使用场景TPC组织发布了多项测试标准。 TPC-H是决策支持的基准测试。它由一套面向业务的即席查询和并发数据修改组成。这些查询和填充数据库的数据具有广泛的行业相关性。

TPC-H 2.17.3: TPC-H是数据库性能基准测试领域的一个重要标准，由Transaction Processing Performance Council（TPC）制定。这个测试主要用于衡量大数据环境下的决策支持系统（Decision Support Systems, DSS）的性能。2.17.3版本...

TPC-H_Tools_v2.18.0: TPC-H_Tools_v2.18.0 是一套针对大数据处理性能基准测试的工具集，主要用于衡量数据库管理系统（DBMS）在复杂商务智能（BI）查询上的性能。该工具基于TPC-H标准，这是一个广泛认可的业界基准，用于评估在大数据量下...

TPC-DS tools压测工具源码下载TPC-DS_Tools_v3.2.0.zip: 5. **性能测试**：DSGen生成的数据集可以配合其他工具（如Apache Hive、Impala或Spark SQL）执行TPC-DS的查询集，这些查询涵盖了各种复杂的SQL操作，以全面评估系统的查询性能、并发处理能力和稳定性。 6. **结果...

TPCDS测试-99条Hive基准测试流程: Hive作为Apache Hadoop生态系统中的一个数据仓库工具，经常被用于处理大规模的数据分析任务。本篇文章将详细介绍如何进行TPCDS在Hive上的基准测试流程，以及相关的技术要点。 **一、TPCDS简介** TPCDS是一个决策...

TPC-DS测试包及tpc测试标准说明: 2. **TPC-DS建表脚本**：这是用来在你的数据库系统（如Hive）中创建符合TPC-DS标准的表结构的SQL语句集合。这些表通常具有复杂的关系和大量的维度，模拟真实世界的业务数据。建表脚本的正确执行是确保测试有效性的...

TPC_H_TOOLS工具包: TPC-H（商业智能计算测试）是美国交易处理效能委员会(TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集.目前,在学术界和工业界普遍采用它来评价决策支持技术方面...

大数据平台测试数据生产-使用TPC-H生成测试数据: TPC-H(商业智能计算测试)是TPC的重要测试标准之一，主要用来模拟真实商业的应用环境。 TPC-H 用 3NF 实现了一个数据仓库,共包含 8 个基本关系/表,其中表REGION和表NATION的记录数是固定的(分别为5和25)，其它6个表...

TPCH.zip_SQL reference_TPC-H_tpc_tpch_tpch.pdf: 《TPC-H.zip：SQL参考与TPC-H测试基准详解》 TPC-H是一个广泛用于评估数据库管理系统（DBMS）在复杂商务智能查询性能上的标准测试基准。此压缩包“TPCH.zip”包含了关于TPC-H的重要参考资料，特别是对于那些在SQL...

Global site tag (gtag.js) - Google Analytics