Trafodion简介
Trafodion是一个构建在Hadoop/HBase基础之上的关系型数据库,它完全开源免费。Trafodion能够完整地支持ANSI SQL,并且提供ACID事务保证。和传统关系数据库不同的地方在于,Trafodion利用底层Hadoop的横向扩展能力,可以提供极高的扩展性。而传统数据库,比如MySQL,在数据量达到P级别的时候就很难处理。而Trafodion却可以借助HBase的扩展性,仅通过增加普通Linux服务器就可以增加计算和存储能力,进而支持大数据应用。
比如原来使用MySQL的用户,如果数据量持续增加,往往需要采用前后端cache,分库分表,读写分离等技术。但是这些技术带来的弊端也很多。比如分库分表的构架下,不同分库之间无法执行join操作。采用这些复杂技术后,系统结构复杂,维护和开发成本提高。这是很多客户正在面临的问题。
而从使用开发的角度来看,Trafodion和MySQL是完全一样的,他们同样是关系型数据库,基本的功能完全一致。因此一个经典的LAMP网络应用也可以轻松地用LATP(Linux, Apache, Trafodion, PHP) 搭建。而采用Trafodion,当业务扩展时,通过增加节点就可以应付不断增加的数据量,应用程序无需做任何修改,也无需考虑复杂的分库分表,读写分离等技术。这样就极大地降低了系统的复杂度。
这只是Trafodion的可能应用之一,Trafodion还是一个非常适合的实时大数据分析平台。因为它不仅可以支持实时分析,而且能够支持实时数据写入,比如每秒上万条的随机数据插入。这是构建实时分析所必备的能力。Stinger或者Impala虽然可以提供实时查询,但去无法支持实时的数据插入。
比如交通实时分析,利用Stinger/Impala等技术,虽然查询和分析可以在1分钟内完成,但是数据却只能定期载入,如果1小时一次,那么分析的数据样本是1小时前的数据,其分析结果也失去了时效性。比如,用户已经在那里堵车堵了了1个小时。
关于Trafodion的使用场景读者可以参阅其他介绍Trafodion的系列文章。本文简要介绍Trafodion的技术体系结构,帮助读者基本了解Trafodion内部运作的原理。
读者还可以参考https://wiki.trafodion.org/wiki/index.php/Architecture了解Trafodion的技术构架。
相关推荐
在"incubator-trafodion-master"这个压缩包中,包含了Trafodion项目的源代码,我们需要找到ODBC驱动相关的模块并进行编译。通常,ODBC驱动程序包含头文件、源代码文件和必要的配置文件,这些文件在Trafodion源码树中...
trafodion数据库驱动,1.6.3版本的驱动,改版本的驱动不好找,有需要的自取。
易鲸捷trafodion数据库,MDAM详解;这是易鲸捷数据库特有的优化方式
从零开始安装Trafodion
大数据图标大全中列举了众多大数据领域中常用的工具和框架,这些工具涵盖了数据的收集、存储、处理、分析、可视化以及安全等多个方面。以下是对这些工具的详细解释: 1. **Falcon**: 一个数据生命周期管理框架,...
在数据库的历史发展中,1970年代的关系模型理论奠定了现代数据库的基础,而互联网的崛起和大数据的爆发则催生了分布式No SQL数据库和KV存储格式,以应对非结构化数据和海量数据的挑战。随着技术的进步,Gartner提出...
易鲸捷国产数据库在银行核心系统的应用展示了中国在数据库技术领域的突破与创新。随着科技的发展,数据库技术也在不断演进,从传统的集中式关系型数据库到分布式No SQL数据库,再到现在的混合事务分析处理(HTAP)...
易鲸捷是一家专注于数据库软件研发的公司,其主要...总的来说,易鲸捷的国产分布式数据库在金融行业中的应用展示了其技术创新和强大的数据库解决方案,能够满足金融行业对于高并发交易处理和海量数据分析的复杂需求。
传统的关系数据库管理系统(RDBMS)通过锁来实现事务,这在分布式环境中可能会产生死锁、闲置等待的问题,并且实现起来既复杂又昂贵。而HBase采取的是一种乐观并发控制(Optimistic Concurrency Control, OCC)的...
SQL引擎是用于处理和查询分布式数据的重要工具,尤其在大数据领域。本篇文章将探讨几个主流的开源SQL引擎,包括Hive、Impala、Spark SQL、Drill、HAWQ和Presto,以及Calcite、Kylin、Phoenix、Tajo和Trafodion等。...
1. 海量存储:HBase能处理极大规模的数据,单表可以达到数十亿行、数百万列,存储能力远超传统的关系型数据库。 2. 列式存储:表结构灵活,无需预先定义列,仅插入需要的数据,便于权限控制和按列读取。 3. 多版本:...
Linux项目是一个开放源代码的操作系统项目,由林纳斯·托瓦兹(Linus Torvalds)于1991年首次发布。该项目以Linux内核为核心,围绕其构建了一个完整的操作系统,包括各种系统工具、库、应用程序和硬件支持。...
C++这个词在中国大陆的程序员圈子中通常被读做“C加加”,而西方的程序员通常读做“C plus plus”,“CPP”。 在C基础上,一九八三年又由贝尔实验室的Bjarne Strou-strup推出了C++。 C++进一步扩充和完善了C语言,...
在 SpringBoot 项目中,需要配置 Druid 管理后台,以便于查看数据库连接池的状态。首先,需要在配置类中添加 Druid 的 Servlet 和 Filter: ```java package com.example.eurekaclient.config; import ...
3. **数据加载**:借助shell解释器,调用ODB工具(如EsgynDB的工具)将CSV文件加载到Trafodion表中。 4. **数据报告**:运行分析或报告查询,对已加载的数据进行可视化展示。 通过这种方式,Apache Zeppelin提供了...