钱魏Way

941篇文章

Python数据应用开发库Taipy

Taipy简介 Taipy 是一个开源的 Python 库,用于构建决策支持系统(Decision Support Systems, DSS)和数据驱动的应用程序。它专注于快速开发、交互性和可扩展性,适合数据科学家、开发人员以及业务用户使用。Taipy…

器→工具, 开源项目 ·

Pandas Dataframe数据美化输出

在 Pandas 中,DataFrame.head() 方法默认输出一个格式化的表格,这在 Jupyter Notebook 或终端中查看时通常已经比较可读。但是,如果你希望以更好的文本格式输出,尤其是在需要将输出嵌入到其他文档或日志中时, …

数据, 术→技巧, 研发 ·

多云数据管理平台Zenko

Zenko简介 Zenko 是一个开源的多云数据管理平台,由 Scality 公司开发和维护。Zenko 旨在帮助企业和组织在多个云存储提供商之间实现数据的统一管理和自动化迁移。通过 Zenko,用户可以轻松地在 AWS S3、Azure Blob…

器→工具, 工具软件 ·

高性能列式存储数据库Vertica

Vertica简介 Vertica 是一款基于列存储的 MPP(大规模并行处理)架构的数据库,专为大数据分析而设计。它可以支持存储 PB(拍字节)级别的大量结构化数据。 发展历程 起源:HP Vertica 最初由 Michael S…

器→工具, 工具软件 ·

分布式图数据库TigerGraph

TigerGraph简介 TigerGraph 是一种高性能的分布式图数据库,专为处理大规模图数据和复杂的图分析任务而设计。它提供了强大的功能和灵活的查询能力,能够支持实时分析和大规模数据处理。 主要特性 GSQL …

器→工具, 工具软件 ·

现代数据架构Open Data Lake (ODL)

Open Data Lake简介 Open Data Lake 是一种数据存储和管理架构,旨在以一种开放、灵活和可扩展的方式处理大量的多结构化数据。数据湖的概念是将数据以原始格式存储,以便在需要时进行分析和处理。Open Data Lake …

数据, 术→技巧 ·

什么是NewSQL 数据库?

NewSQL 数据库是一类结合了传统关系型数据库(RDBMS)的强一致性和事务支持(ACID),以及 NoSQL 数据库的高扩展性和分布式架构的新型数据库系统。它针对高并发、海量数据处理场景进行了优化,尤其适用于现代互联网…

器→工具, 工具软件 ·

分布式 SQL 数据库SingleStore

SingleStore简介 SingleStore(以前称为MemSQL)是一种现代化的分布式SQL数据库管理系统, 专为实时分析和事务处理设计。它结合了行存储和列存储技术,能够在单一平台上支持混合事务和分析处理(HTAP)。SingleSto…

器→工具, 工具软件 ·

轻量级目录访问协议LDAP与OpenLDAP

LDAP简介 LDAP(轻量级目录访问协议,Lightweight Directory Access Protocol)是一种用于访问和维护分布式目录信息服务的开放式、厂商中立的协议。它是在 1990 年代早期由 IETF(互联网工程任务组)开发的,旨在…

器→工具, 工具软件 ·

开源ETL工具Pentaho Kettle

Kettle简介 Kettle(Pentaho Data Integration)是一个功能强大且灵活的开源数据集成工具,专为需要高效处理和转换数据的用户设计。通过提供丰富的转换功能和广泛的数据源支持,Kettle 帮助用户实现复杂的数据集成…

器→工具, 工具软件 ·