`
lookqlp
  • 浏览: 346118 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

impala使用

阅读更多
1.登陆
impala-shell -i cslave1

2.refresh
refresh table_name:当有文件更新时
INVALIDATE METADATA;当有刚创建的表
3.中文code不支持问题
impala-shell -i cslave1
[cslave1:21000] >select count(1) from s_trade where receiver_name = '李丹';
Unknown Exception : 'ascii' codec can't encode characters in position: ordinal not in range
官方issue https://issues.cloudera.org/browse/IMPALA-607
解决:
vim /usr/lib/impala-shell/impala_shell.py
def do_select(self, args):
    """Executes a SELECT... query, fetching all rows"""
    return self.__execute_query(self.__create_beeswax_query("select %s" % args))
修改成:
def do_select(self, args):
    """Executes a SELECT... query, fetching all rows"""
    return self.__execute_query(self.__create_beeswax_query("select %s" %(args.encode('utf-8'),)))
修改后:
[cslave1:21000] > select count(1) from s_trade where receiver_name = '李丹';
Query: select count(1) from s_trade where receiver_name = '李丹'
+----------+
| count(1) |
+----------+
| 822      |
+----------+
Returned 1 row(s) in 1.62s
分享到:
评论

相关推荐

    impala-2.9.pdf

    * Impala SQL Dialect:Impala 使用的一种基于 SQL 的查询语言 * Impala Programming Interfaces:Impala 提供了多种编程接口,例如 JDBC、ODBC 等 Impala 在 Hadoop 生态系统中的角色 Impala 在 Hadoop 生态系统...

    dbeaver impala jdbc连接包

    Impala使用SQL语法,与传统的批处理框架Hive相比,提供了更快速的查询性能。 4. **CDH**: Cloudera Data Hub (CDH)是一个全面的Apache Hadoop发行版,包含了Hadoop生态系统中的多个组件,如Hadoop、Hive、Pig、...

    impala快速入门手册

    下面是 Impala 的快速入门手册,旨在指导新手快速使用 Impala 做数据分析工作。 1. 什么是 Impala? Impala 是一款开源的高性能、实时查询引擎,基于 Apache Hadoop,能够快速处理大量数据。Impala 的主要特点是高...

    impala中substr()截取中文字符串乱码的问题

    5. **使用UDF**:注册成功后,你就可以在Impala SQL查询中使用`substr_udf()`函数了,它会根据你的实现正确处理中文字符串。 需要注意的是,创建UDF时应确保函数的性能尽可能高效,因为Impala中的UDF会在执行时影响...

    impala官方文档

    - Impala使用了自己的资源管理系统,而不是依赖YARN等Hadoop资源管理器。 - 能够动态调整查询执行过程中分配给各个节点的资源。 4. **兼容性**: - Impala支持与Hive共享元数据,这意味着用户可以在Hive和Impala...

    cloudera-impala官方手册

    - **兼容性**:Impala 与 Hive 元数据服务高度兼容,这意味着用户可以在不修改现有 Hive 表的情况下直接使用 Impala 进行查询。 - **易于部署和管理**:Cloudera Manager 提供了一个统一的界面用于部署、配置和监控 ...

    impala 详细使用手册.pdf

    本篇将根据《impala 详细使用手册》中的内容,对 Apache Impala 的基本概念、工作原理、架构组成及其在 Hadoop 生态系统中的位置进行深入探讨。 #### Apache Impala 简介 Apache Impala 是由 Cloudera 开发并贡献...

    Impala并发查询缓慢问题解决方案.docx

    * 需要修改业务用户通过Impala使用这些表的方式 解决方案二:重新生成 Parquet 表 Impala 并发查询缓慢问题的另一个主要原因是 Parquet 表由 Hive 或者 Spark 生成。如果重新生成这些 Parquet 表,可以解决这个...

    尚硅谷大数据技术之 Impala1

    - 它基于Hive构建,但与Hive相比,Impala使用内存计算,使得查询速度显著提升。 - Impala在CDH(Cloudera Distribution Including Apache Hadoop)平台上作为首选的大数据实时查询分析引擎,能够支持PB级别的大...

    Impala用户指南

    - **INVALIDATE METADATA**:刷新元数据缓存,以确保Impala使用最新的表定义。 - **REFRESH TABLE**:更新特定表的元数据,使其与底层数据保持一致。 #### 2.2 DML操作 - **LOAD DATA**:用于加载数据到HDFS中,并...

    JDBC Driver for Impala 的使用教程

    **JDBC Driver for Impala使用教程** 在Java编程中,JDBC(Java Database Connectivity)是连接数据库的标准接口,使得开发者可以使用Java语言与各种不同类型的数据库进行交互。Impala是Cloudera公司开发的一个高...

    cloudera-impala.pdf )

    - **内存计算**:Impala 使用内存计算技术来减少磁盘 I/O 操作,这显著加快了查询速度。 - **并行处理**:Impala 的 MPP 架构允许它在集群内的多个节点上并行执行查询,从而实现更高的处理能力。 ##### 从关系型...

    Impala在大数据中的使用和优化实践.pdf

    Impala 在大数据中的使用和优化实践 Impala 是一个基于大数据的查询引擎,能够提供高性能的查询服务。它可以处理大量的数据,并提供了许多优化的实践经验。下面将详细介绍 Impala 在大数据中的使用和优化实践。 1....

    impala的使用教程

    impala的使用教程impala的使用教程impala的使用教程impala的使用教程impala的使用教程

    大数据Impala架构原理.pdf

    - **Hive Metastore**:Impala使用Hive的元数据服务来获取表和分区的信息,包括表的结构、位置、分区等。 - **HDFS NN(NameNode)**:作为Hadoop文件系统的中心节点,负责管理和存储文件系统的元数据。 - **...

    springboot集成impala(包含yml、impala配置类、pom.xml、impala jar)

    4. 在你的服务或DAO层,你可以使用Spring提供的`@Autowired`来注入数据源,并使用JdbcTemplate或JPA进行查询操作。 5. 最后,确保你的Impala服务是运行的,并且SpringBoot应用能够访问到网络上的Impala服务。 以上...

    Cloudera_ImpalaJDBC41_2.5.41.zip

    4. **zookeeper-3.4.6.jar**:ZooKeeper 是一个分布式协调服务,Impala 使用 ZooKeeper 来管理和发现服务节点,确保高可用性和一致性。 5. **hive_service.jar**:这个文件可能包含 Hive 服务的相关组件,可能用于...

    Hadoop databases: Hive, Impala, Spark, Presto For ORACLE DBAs

    与 Hive 相比,Impala 使用内存优化的执行引擎,因此查询速度更快。这对于 Oracle DBA 来说是一个重要的特性,因为这意味着他们可以在不牺牲性能的情况下使用熟悉的 SQL 语法进行数据查询。 示例: ``` sql> select...

    impalajdbc41

    2. **Impala使用场景**:Impala适用于实时查询大规模数据集,尤其适合在线分析处理(OLAP)和交互式数据分析。由于其低延迟特性,它在大数据环境中的实时报表、数据分析和数据探索方面表现突出。 3. **集成到Java...

Global site tag (gtag.js) - Google Analytics