标签: 数据仓库

云原生数据仓库Databend

Databend简介 Databend 是一个开源的云原生数据仓库,专为现代数据分析需求设计,旨在提供高性能、高弹性和易于使用的数据分析解决方案。Databend 的架构充分利用了云计算的优势,支持大规模数据处理和实时分析,…

器→工具, 工具软件 ·

基于Hadoop的数仓Apache HAWQ

Apache HAWQ简介 Apache HAWQ(Hadoop with Query)是一个高性能的并行 SQL 数据仓库,专为在 Hadoop 上运行而设计。HAWQ 结合了传统关系型数据库的成熟分析能力和 Hadoop 的大规模数据处理能力,旨在为大数据环境…

器→工具, 开源项目 ·

实时分布式 OLAP分析系统Pinot

Pinot简介 Apache Pinot 是一个实时分布式 OLAP 数据存储和分析系统,专为低延迟、高吞吐量的查询而设计。Pinot 最初由 LinkedIn 开发,用于支持其内部的分析应用,如 LinkedIn 的 "Who Viewed My Profile" 和其他…

器→工具, 开源项目 ·

嵌入式OLAP系统DuckDB

DuckDB简介 DuckDB 是一个开源的嵌入式在线分析处理(OLAP)数据库管理系统,专为快速分析查询而设计。它被称为“SQLite for Analytics”,因为它的设计目标是提供类似于 SQLite 的嵌入式数据库体验,专注于分析工作…

器→工具, 开源项目 ·

开源OLAP分析引擎Kylin

Kylin简介 Apache Kylin 是一个开源的分布式分析型数据仓库,专门用于大规模数据集的实时分析。它最初由 eBay 开发,并于 2015 年成为 Apache 软件基金会的顶级项目。Kylin 通过提供 SQL 接口和多维分析(OLAP)功…

器→工具, 开源项目 ·

开源实时分析数据库Druid

Druid简介 Apache Druid 是一个开源的分布式实时分析数据库,专为高性能的 OLAP(在线分析处理)查询而设计。Druid 的设计目标是提供低延迟的数据摄取、快速的查询响应和高效的数据聚合能力,使其非常适合于需要实…

器→工具, 开源项目 ·

实时数据分析数据库Doris

Doris简介 Apache Doris 是一个现代化的实时数据分析数据库,旨在提供高性能的交互式 SQL 查询分析。它最初由百度开发,并贡献给 Apache 软件基金会。Doris 的设计目标是为大规模数据分析提供简单易用、快速且高效…

器→工具, 开源项目 ·

数据湖存储系统Paimon

Paimon简介 Apache Paimon 是一个面向大数据生态系统的高性能数据湖存储系统。它最初是由 Flink 社区开发的,旨在为大数据处理提供高效的存储解决方案。 Apache Paimon(以前称为 Flink Table Store)是一…

器→工具, 开源项目 ·

分布式OLAP数据库StarRocks

StarRocks简介 StarRocks 是一个高性能的分布式关系型数据库,专为在线分析处理(OLAP)场景而设计。它起源于 Apache Doris 项目,并在此基础上进行了大量优化和改进。 StarRocks的存储引擎 StarRocks 主要…

器→工具, 开源项目 ·

数据仓库之列式存储ClickHouse

ClickHouse简介 ClickHouse 是一个开源的列式数据库管理系统(Column-Oriented DBMS),专为实时大数据分析而设计。它支持实时查询,能够处理PB级别的数据,并且在大多数情况下提供了非常高的查询性能。ClickHouse…

数据, 术→技巧 ·