`
bupt04406
  • 浏览: 348295 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

hive 两个不同类型的columns进行比较

    博客分类:
  • Hive
 
阅读更多
select case when "ab1234"<>"123" then 1 else 0 end as flag from src limit 1;
1

select case when "ab1234"<>123 then 1 else 0 end as flag from src limit 1;
0

select case when "ab1234"<> cast(123 as bigint) then 1 else 0 end as flag from src limit 1;
0

"ab1234"<>123 两个类型进行比较时:
123转换double
"ab1234"也要转换成double进行比较,但是转换时转换不成,返回null。
所以"ab1234"<>123进行比较时返回null,不为true。

代码在GenericUDFBaseCompare中。
https://issues.apache.org/jira/browse/HIVE-2248
分享到:
评论
2 楼 bupt04406 2011-09-22  
是的,但是ab1234这个转成double是null
clarkyzl 写道
那个,社区版也是这样的吗?我记得这里好像动过一点,和社区版有点不同,我们是全转double的。

1 楼 clarkyzl 2011-09-22  
那个,社区版也是这样的吗?我记得这里好像动过一点,和社区版有点不同,我们是全转double的。

相关推荐

    Apache Hive Functions Cheat Sheet

    例如round()函数有两个版本,第一个版本round(double a)可以四舍五入一个小数到最近的整数,第二个版本round(double a, int d)可以根据提供的小数位数d进行四舍五入。floor(double a)函数返回小于或等于参数的最大...

    Hive用户指南 Hive user guide 中文版

    元数据库可以使用两种不同的实现方式: - **Derby**:Derby是一种轻量级的嵌入式数据库,主要用于测试和小型项目。Hive默认使用Derby作为元数据库。 - **MySQL**:对于生产环境中的大型部署,通常推荐使用MySQL...

    Hive使用手册Hive使用手册

    - 表连接允许合并来自两个或更多表的数据。 - 子查询在查询语句中嵌套另一个查询,用于筛选或聚合数据。 - UNION ALL用于合并多个SELECT结果集,不剔除重复行。 9. **Hive使用注意点** - 确保数据格式与表结构...

    Hive基本命令整理

    例如,创建一个名为 pokes 的表,具有两个列,一个整型,一个字符串型: ``` hive&gt; CREATE TABLE pokes (foo INT, bar STRING); ``` 创建一个名为 new_table 的表,结构与 records 表相同: ``` hive&gt; create table ...

    hive参数优化总结

    Map 数和 Reduce 数是 Hive 中两个非常重要的参数,直接影响着 Hive 的性能和效率。 1.1、Map 数 Map 数是 Hive 中一个非常重要的参数,影响着数据处理的速度和效率。Map 数太大将导致 Map 阶段输出文件太小,产生...

    Hive大数据仓库-笔记整理 (一)2020年最新版.pdf

    Hive是大数据处理领域的一个重要工具,主要用于对大规模数据集进行结构化查询和分析。它构建在Hadoop之上,能够将SQL(结构化查询语言)转换为MapReduce任务,使得非程序员也能方便地操作和查询大数据。以下是关于...

    hive和hbase整合

    Hive和HBase是两个大数据处理的重要组件。Hive提供了基于SQL的查询语言(HQL)来处理大规模的数据,适合于离线批处理;而HBase则是一个NoSQL数据库,它基于Google的Bigtable设计,提供高并发、低延迟的实时数据访问...

    HIVE-SQL操作语句

    该命令创建了一个名为 `pokes` 的新表,并定义了两个字段:`foo` 类型为 `INT` 和 `bar` 类型为 `STRING`。 如果希望创建分区表,可以使用以下命令: ```sql hive&gt; CREATE TABLE invites (foo INT, bar STRING) ...

    Hive用户指南(Hive_user_guide)_中文版

    - **Hadoop系统**:Hive依赖Hadoop的两大核心组件HDFS和MapReduce进行数据存储和并行计算。 **1.2 Hive和Hadoop的关系** Hive是构建在Hadoop之上的一个工具层,旨在为Hadoop提供一种更加方便的SQL-like查询语言...

    Hive数据导入HBase的方法.docx

    Hive 是一个基于 Hadoop 的数据仓库工具,而 HBase 是一个基于 Hadoop 的 NoSQL 数据库。它们都是大数据处理的重要组件。在数据处理过程中,经常需要将数据从 Hive 导入到 HBase 中。本文将详细介绍 Hive 数据导入 ...

    hive 整合 hbase

    这里创建了一个名为`h2h`的表,包含两个列族`f1`和`f2`。 - **插入数据**:通过`put`命令向表中插入数据。例如:`put 'h2h','rk1','f1:c1','name1'`,表示向表`h2h`中插入一条记录,其中行键为`rk1`,列族`f1`,列名...

    hive常用命令

    ### Hive常用命令详解 ... - 对两个表进行内连接,并将结果插入`events`表。 通过以上命令的学习和应用,您可以更高效地管理和操作Hive中的数据,实现数据的快速查询和分析,从而提升数据分析的效率和准确性。

    大数据工具篇之Hive与HBase整合完整教程

    请注意,不同版本之间的兼容性和配置可能有所不同,因此建议按照上述版本进行实践。 #### 三、配置指南 为了使 Hive 能够与 HBase 无缝对接,需要进行一系列的配置。这里主要介绍如何正确配置 `hive-site.xml` ...

    hive入门资料

    Hive中的表主要有两种类型:内部表和外部表。 - **内部表**:当删除内部表时,Hadoop上的数据也会被删除。这种类型的表适用于中间表或结果表,通常不需要从外部(例如本地文件或HDFS)加载数据。创建内部表的语法...

    基于Facebook的Hive开发

    这段代码展示了如何创建一个名为`src`的表,该表包含两个字段:`key`和`value`,均使用字符串类型。此外,还指定了分区字段`ds`以及存储位置`/hive/src`,并选择以文本文件的方式存储数据。 ##### 查询表 ```sql ...

    Hive配置和基本操作.pdf

    例如,`CREATE TABLE pokes (foo INT, bar STRING)` 创建了一个名为 `pokes` 的表,包含两个字段,一个是整型(`INT`),另一个是字符串型(`STRING`)。 2. **复制表结构**:`create table new_table like records...

    02 Hive学习总结及应用.pdf

    Hive中的表有两种主要类型:托管表和外部表。托管表的数据存储在Hive的默认数据仓库目录下,由Hive完全管理,当删除表时,数据也会一同被删除。而外部表则不存储在Hive的数据仓库中,它的数据位于用户指定的HDFS路径...

Global site tag (gtag.js) - Google Analytics