`
freeheron
  • 浏览: 68187 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

面向列的mysql数据库引擎-BRIGHTHOUSE(infobright数据库)

    博客分类:
  • BI
阅读更多

       brighthouse 是infobright 数据库的关键引擎。infobright 数据库是基于mysql的,它的设计主要是用于大规模的数据仓库和分析优化。可以去www.infobright.org下载开源社区版。

       它的安装非常简单:解开了下载的gz包后,直接运行install-infobright.sh就ok了,在redhat5下安装基本没有遇到任何麻烦。

       安装之后,它的配置文件是/etc/my-ib.cnf. 启动脚本是/etc/init.d/mysqld-ib. 客户端命令是mysql-ib.

       如果所安装的机器上同时安装有其他mysql,可能就有一点小麻烦了:没法正常使用mysql-ib命令。这只要是my.cnf搞的鬼。尽管infobright用的配置文件是/etc/my-ib.cnf,但是my.cnf也会干扰。比如,如果在my.cnf中有‘comment’的配置项,当运行mysql-ib,就会有这样的错误:unknown option '--comment'。

 

       装完之后试了试,果然不赖。导入了5000万行记录,一条count语句不到30秒。想想在innoDB上,没有个10分钟出不来。

      当前的版本支持30T的数据,采用的是数据压缩的存储方式,压缩比例可达40:1。原来5000万行的数据,十多G呢,导入infobright之后,我一直到琢磨:它把我那5000多万行记录放哪去了^_^

 

      这东西好是好,不过有不少不爽的地方:

  •  开源版不支持insert等数据操作语句,导入数据只能用load语句(这个导入数据很快)
  •  还不支持UTF-8(这个最烦人了,尽管它提供了一种方案来解决这个问题)
  • 企业版可也不便宜$10000/T (mysql才600刀)(数据仓库类的软件都很贵,这已经算很便宜的了^_^)
  • 跟我们平常用的其他引擎(如innodb)不是很兼容,比如不支持bit类型;position也是关键字,不能用来做字段名。反正是使用在innodb上的数据库脚本可能不能在这上直接使用。(这都算,太懒了^_^)
0
0
分享到:
评论

相关推荐

    infobright最新安装包.zip

    9. **监控与维护**: 使用Infobright提供的监控工具,如`brighthouse`,可以查看系统状态、性能指标和资源利用率,以确保数据库运行良好。 Infobright适用于大数据实时分析场景,尤其在日志分析、商业智能和数据仓库...

    infobright-rpm.zip

    Infobright的核心技术是其专利的压缩算法——Brighthouse Storage Engine(BSE),它能够以极高的压缩率存储数据,从而显著降低存储成本。在4.0.7这个版本中,可能包含了性能优化、bug修复以及对硬件和操作系统平台...

    Infobright原理

    Infobright的架构基于MySQL,但采用了专门设计的存储引擎——Brighthouse。这个引擎支持多种存储引擎,如MyISAM、MRG_MyISAM、Memory和CSV,但默认使用Brighthouse,因为它提供了更高级别的压缩和查询效率。...

    infobright-4.0.7-0-x86-64-ice.rpm

    在本例中,“infobright-rpm.zip”是一个包含了Infobright数据库相关RPM软件包的压缩文件,具体为“infobright-4.0.7-0-x86_64-ice.rpm”。Infobright的核心技术是其专利的压缩算法——Brighthouse Storage Engine...

    安装infobright

    Infobright是一款高效的数据仓库系统,它以列式存储的方式设计,特别适合处理大量数据分析任务。列式存储的优势在于,对于查询操作,尤其是涉及多列的聚合查询,它能显著提高查询速度,因为只需读取所需列的数据,而...

    Infobright的存储实现

    Infobright提供了一种创新的数据仓库解决方案——Brighthouse,它是一种面向列存储的数据仓库,旨在优化针对特定列的复杂分析查询的执行效率。这种设计特别适合于数据挖掘和在线分析处理(OLAP)场景,能够显著减少...

    【SEC-2025行业研究报告】Form 10-K BRIGHTHOUSE LIFE INSURANCE Co .pdf

    从文件内容可以看出,Brighthouse Life Insurance Company是提交这份报告的公司。报告中提供了公司的注册信息,包括注册地为特拉华州,公司名、注册号码、公司地址、邮政编码以及电话号码。这为读者提供了一个基础,...

    MySQLMigrationGuide

    IEE 包含了一个捆绑版本的 MySQL,并会在安装过程中创建一个全新的 MySQL 实例,同时还包括 ColumnOptimizer、Optimizer、KnowledgeGrid、Infobright Loader 以及底层的列式存储架构。在安装 IEE 之前,需要确保任何...

    汇报1-大数据研究现状探讨42.pptx

    - **HBase**:分布式、面向列的NoSQL数据库,支持大规模表的随机读取。 - **Hive**:基于Hadoop的数据仓库工具,提供SQL-like查询语言HiveQL。 - **Pig**:用于数据清洗和转换的高级编程环境。 - **Sqoop**:...

    大数据研究现状探讨.pptx

    此外,还有一些针对特定需求的解决方案,如Infobright的Brighthouse,它是一个基于列的自调整数据仓库,利用粗集理论(Rough Set)和粒度计算(Granular Computing),实现高效的数据管理和优化执行。Starfish系统则...

    基于列式存储的铁道供电监控信息快速查询与压缩处理研究__铁道供电相关专业论文毕业设计范文.pdf

    利用Brighthouse列存储引擎,建立了大比率压缩存储模型,通过实际工程数据验证了其处理性能。 总之,这项研究为铁道供电监控大数据集的信息高效压缩和快速查询提供了新的解决方案,关键词包括:铁道供电监控、...

Global site tag (gtag.js) - Google Analytics