开源MySQL数据解决方案Infobright

9 sec read

数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

Infobright是一款开源列式数据仓库引擎,采用他们自己的Knowledge Grid架构,该引擎采取内部管理自身优化查询的方式。 

Infobright像很多优秀的开源软件一样,也都具有两个版本,社区版(ICE)和企业版(IEE),多数情况下,如果免费的能满足我们的实际需求,领导更愿意采用社区版;企业版需要付费,那么自然就会给用户提供更加完善的功能、保证运行的稳定性以及良好的后期服务。

Infobright的基本特征:

优点:

  1. 查询性能高:百万、千万、亿级记录数条件下,同等的SELECT查询语句,速度比MyISAM、InnoDB等普通的MySQL存储引擎快5~60倍
  2. 存储数据量大:TB级数据大小,几十亿条记录,随着数据库的逐渐增大,查询和装载性能基本保持稳定。
  3. 高压缩比:在我们的项目中为18:1,极大地节省了数据存储空间
  4. 基于列存储:无需建索引,无需分区
  5. 没有特殊的数据仓库模型(比如星状模型、雪花模型)要求
  6. 实施和管理简单,需要极少的管理
  7. 快速响应复杂的分析性SQL查询:SUM, COUNT, AVG, GROUP BY
  8. 和众多的BI套件相容,比如Pentaho、Cognos、Jaspersoft。

限制:

不支持数据更新:社区版Infobright只能使用“LOAD DATA INFILE”的方式导入数据,不支持INSERT、UPDATE、DELETE

不支持高并发:只能支持10多个并发查询

官方网址:http://www.infobright.org/

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

机器学习算法之决策树

什么是决策树 决策树(decision tree)是一种依托于策略抉择而建立起来的树。机器学习中,决策树是一个
8 min read

贝塞尔曲线学习笔记

什么是贝塞尔曲线 贝塞尔曲线的数学基础是早在 1912 年就广为人知的伯恩斯坦多项式。但直到 1959 年,当
46 sec read

KNN算法实战:验证码的识别

识别验证码的方式很多,如tesseract、SVM等。前面的几篇文章介绍了KNN算法,今天主要学习的是如何使用
3 min read

发表评论

电子邮件地址不会被公开。 必填项已用*标注