标签: 数据仓库

云原生数据仓库Databend

Databend简介 Databend是一个开源的云原生数据仓库,专为现代数据分析需求设计,旨在提供高性能、高弹性和易于使用的数据分析解决方案。Databend的架构充分利用了云计算的优势,支持大规模数据处理和实时分析,适合…

器→工具, 工具软件 ·

基于Hadoop的数仓Apache HAWQ

Apache HAWQ 简介 Apache HAWQ(Hadoop with Query)是一个高性能的并行 SQL 数据仓库,专为在 Hadoop 上运行而设计。HAWQ 结合了传统关系型数据库的成熟分析能力和 Hadoop 的大规模数据处理能力,旨在为大数据环境…

器→工具, 开源项目 ·

实时分布式 OLAP分析系统Pinot

Pinot 简介 Apache Pinot 是一个实时分布式 OLAP 数据存储和分析系统,专为低延迟、高吞吐量的查询而设计。Pinot 最初由 LinkedIn 开发,用于支持其内部的分析应用,如 LinkedIn 的 "Who Viewed My Profile" 和其他…

器→工具, 开源项目 ·

嵌入式OLAP系统DuckDB

DuckDB简介 DuckDB是一个开源的嵌入式在线分析处理(OLAP)数据库管理系统,专为快速分析查询而设计。它被称为“SQLite for Analytics”,因为它的设计目标是提供类似于SQLite的嵌入式数据库体验,专注于分析工作负载…

器→工具, 开源项目 ·

开源OLAP分析引擎Kylin

Kylin简介 Apache Kylin是一个开源的分布式分析型数据仓库,专门用于大规模数据集的实时分析。它最初由eBay开发,并于2015年成为Apache软件基金会的顶级项目。Kylin通过提供SQL接口和多维分析(OLAP)功能,使用户…

器→工具, 开源项目 ·

开源实时分析数据库Druid

Druid简介 Apache Druid是一个开源的分布式实时分析数据库,专为高性能的OLAP(在线分析处理)查询而设计。Druid的设计目标是提供低延迟的数据摄取、快速的查询响应和高效的数据聚合能力,使其非常适合于需要实时数…

器→工具, 开源项目 ·

实时数据分析数据库Doris

Doris简介 Apache Doris是一个现代化的实时数据分析数据库,旨在提供高性能的交互式SQL查询分析。它最初由百度开发,并贡献给Apache软件基金会。Doris的设计目标是为大规模数据分析提供简单易用、快速且高效的解决…

器→工具, 开源项目 ·

数据湖存储系统Paimon

Paimon简介 Apache Paimon是一个面向大数据生态系统的高性能数据湖存储系统。它最初是由Flink社区开发的,旨在为大数据处理提供高效的存储解决方案。 Apache Paimon(以前称为Flink Table Store)是一个专为流处…

器→工具, 开源项目 ·

分布式OLAP数据库StarRocks

StarRocks简介 StarRocks是一个高性能的分布式关系型数据库,专为在线分析处理(OLAP)场景而设计。它起源于Apache Doris项目,并在此基础上进行了大量优化和改进。 StarRocks的存储引擎 StarRocks主要设计为一款…

器→工具, 开源项目 ·

数据仓库之列式存储ClickHouse

ClickHouse简介 ClickHouse是一个开源的列式数据库管理系统(Column-Oriented DBMS),专为实时大数据分析而设计。它支持实时查询,能够处理PB级别的数据,并且在大多数情况下提供了非常高的查询性能。ClickHouse由…

数据, 术→技巧 ·