前些天捧起hongqn拿给我的<mysql性能调优与架构设计>,翻起第一章,还没进入mysql的主题,就被另一个名字吸引住了:infobright,一个基于mysql的数据仓库系统实现,它已经是很多开源或商用BI系统的底层存储引擎。
根据这几天看到的介绍与白皮书,又做了些试验,依据自己的理解先作一个概述性的介绍,下次再描述一下infobright的技术架构。
infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个。mysql可以粗分为逻辑层和物理存储引擎,infobright主要实现的就是一 个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像InnoDB那样直接作为插件挂接到mysql,它的逻辑层是mysql的逻辑 层加上它自身的优化器。
几大优点:
1、高压缩比率,平均压缩比可达10:1,甚至可以达到40:1,我用infobright把3.1G的数据存成不足300M。
2、列存储,即使数据量十分巨大,查询速度也很快。用于数据仓库,处理海量数据没一套可不行。
3、不需要建索引,就避免了维护索引及索引随着数据膨胀的问题。把每列数据分块压缩存放,每块有知识网格节点记录块内的统计信息,代替索引,加速搜索。
4、单一台服务器可以高效地读写30T数据。具有可扩展性,这里是指对于同样的查询,当数据量是10T时,它耗费的时间不应该比1T数据量时慢太多,基本是一个数量级内。
与mysql对比:
1、infobright适用于数据仓库场合,即非事务、非实时、非多并发;分析为主;存放既定的事实(基本不会再变),例如日志,或汇总的大量的 数据。所以它并不适合于应对来自网站用户的请求。实际上它取一条记录比mysql要慢很多,但它取100W条记录会比mysql快。
2、mysql的总数据文件占用空间通常会比实际数据多,因为它还有索引。infobright的压缩能力很强大,按列按不同类型的数据来压缩。
3、服务形式与接口跟mysql一致,可以用类似mysql的方式启用infobright服务,然后原来连接mysql的应用程序都可以以类似的方式连接与查询infobright。这对熟练mysql者来说是个福音,学习成本基本为0。
infobright有两个发布版:开源的ICE及闭源商用的IEE。ICE提供了足够用的功能,但不能INSERT,DELETE,UPDATE,只能LOAD DATA INFILE。IEE除提供更充分的功能外,据说查询速度也要更快。
参考:
1、infobright商业网站:http://www.infobright.com/
2、infobright社区交流网站:http://www.infobright.org/
3、mysql对infobright的介绍:http://dev.mysql.com/tech-resources/articles/datawarehousing_mysql_infobright.html
4、关于infobright的介绍视频:http://www.infobright.com/Resource-Library/Webcasts-Podcasts/?infobright_product_demo
转载请保留本文原始链接:http://www.wentrue.net/blog/?p=283
分享到:
相关推荐
Infobright是一款高效的数据仓库解决方案,专为处理大规模数据集而设计。在Windows 64位操作系统环境下,Infobright提供了强大的分析性能和快速的数据加载能力。标题中的"infobright for windows 64 数据仓库"指的是...
1. **Infobright架构**:Infobright基于MySQL数据库,但设计上专注于数据仓库功能。它采用了列式存储的方式,这与传统的行式存储相比,对于数据分析和查询具有显著优势。列式存储允许快速读取大量数据,特别是在进行...
Infobright是一款开源的MySQL数据仓库引擎,特别针对大数据分析进行了优化。本文将深入探讨Infobright的核心特性,以及如何在Windows系统上安装和使用它。 Infobright的核心特点: 1. **列式存储**:与传统的行式...
MySQL是一种广泛使用的开源关系型...总之,“mysql.rar_infobright”是一个关于MySQL数据库到Infobright数据仓库迁移的资源包,通过这个压缩包,你可以学习到如何利用Infobright的优势来提升大数据分析的效率和性能。
2. **数据仓库(Warehouse)**:数据仓库是为企业决策支持系统设计的中央存储库,它整合了来自多个业务系统的数据。Infobright作为数据仓库工具,擅长处理历史数据,支持复杂的分析查询,帮助企业从海量数据中提取...
( MySQL数据仓库——InfoBright的源码安装及使用.txt )
infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个。mysql可以粗分为逻辑层和物理存储引擎,infobright主要实现的就是一个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像...
Infobright是一款开源的数据仓库系统,专为大数据分析设计,具有高效能、高并发和低存储成本的特点。本文将详细解析Infobright的核心技术、安装过程以及如何利用Infobright-4.0.7-0-x86_64-ice.rpm安装包进行部署。 ...
Infobright的架构基于MySQL,但采用了专门设计的存储引擎——Brighthouse。这个引擎支持多种存储引擎,如MyISAM、MRG_MyISAM、Memory和CSV,但默认使用Brighthouse,因为它提供了更高级别的压缩和查询效率。...
Infobright是一款高效、高性能的开源数据仓库系统,专门设计用于大数据分析。社区版是Infobright提供的免费版本,让开发者和小型企业有机会体验其强大的分析能力。在本压缩包"infobright-社区版.zip"中,包含了...
Infobright是基于MySQL的一个分支,专注于大数据分析,特别适合处理PB级别的数据。它的核心特性包括高度压缩的数据存储、列式存储以及优化的查询引擎。这使得Infobright在处理大数据时能提供出色的性能。 在Ubuntu...
此外,爱可生还介绍了基于MySQL的开源数据仓库产品——Infobright,该产品主要特点如下: 1. **列存储引擎**:Infobright采用列存储方式,相比传统的行存储方式,在数据分析方面具备更高的效率和更好的性能表现。 2...
Infobright最近有部分工作涉及到了 Infobright 数据仓库,就浏览了一些相关的资料,感觉很受启发。下面写一些感想,如有谬误,还请指正。 简单的来讲,Infobright 主要有下面的一些优点: 1. TB 级的数据存储和...
Infobright是一款高效、轻量级的开源数据仓库解决方案,主要设计用于大数据分析。这款数据库管理系统以其出色的查询性能和极低的存储需求而受到关注。标题中的"infobright4.0.7-win.zip"表明这是一个针对Windows操作...