数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
Infobright是一款开源列式数据仓库引擎,采用他们自己的Knowledge Grid架构,该引擎采取内部管理自身优化查询的方式。

Infobright像很多优秀的开源软件一样,也都具有两个版本,社区版(ICE)和企业版(IEE),多数情况下,如果免费的能满足我们的实际需求,领导更愿意采用社区版;企业版需要付费,那么自然就会给用户提供更加完善的功能、保证运行的稳定性以及良好的后期服务。
Infobright的基本特征:
优点:
- 查询性能高:百万、千万、亿级记录数条件下,同等的SELECT查询语句,速度比MyISAM、InnoDB等普通的MySQL存储引擎快5~60倍
- 存储数据量大:TB级数据大小,几十亿条记录,随着数据库的逐渐增大,查询和装载性能基本保持稳定。
- 高压缩比:在我们的项目中为18:1,极大地节省了数据存储空间
- 基于列存储:无需建索引,无需分区
- 没有特殊的数据仓库模型(比如星状模型、雪花模型)要求
- 实施和管理简单,需要极少的管理
- 快速响应复杂的分析性SQL查询:SUM, COUNT, AVG, GROUP BY
- 和众多的BI套件相容,比如Pentaho、Cognos、Jaspersoft。
限制:
不支持数据更新:社区版Infobright只能使用“LOAD DATA INFILE”的方式导入数据,不支持INSERT、UPDATE、DELETE
不支持高并发:只能支持10多个并发查询










该日志还没有评论。