所有文章

Python执行时间的可视化

在前面的文章Python标准库之性能优化 中学习到了统计 Python 代码执行时间的工具。今天要学习的是一些其他的工具。 SnakeViz SnakeViz 简介 SnakeViz 是一个用于可视化 Python 代码性能分析结果的工具。它是基于 Py…

术→技巧, 研发 ·

初步认识RPC框架gRPC

gRPC简介 gRPC是一个现代化的、高性能的远程过程调用(Remote Procedure Call, RPC)框架,由Google开发并开源。它基于HTTP/2协议,使用Protocol Buffers(protobuf)作为接口定义语言(IDL)和数据序列化工具,是…

数据, 术→技巧 ·

开源数据转换和建模工具dbt

dbt简介 dbt (data build tool)是一个开源的数据转换和建模工具,由 dbt Labs 开发和维护。dbt 旨在简化数据仓库中的数据转换和建模过程,帮助数据工程师和分析师高效地管理和执行数据管道。dbt 核心(dbt-core)是…

器→工具, 开源项目 ·

交互式数据分析工具Zeppelin

Zeppelin简介 Apache Zeppelin是一个开源的Notebook工具,旨在为数据科学家、数据工程师和分析师提供一个交互式的环境,用于数据探索、可视化和协作分析。它支持多种后端数据处理引擎,使用户能够在一个统一的界面…

开源事件驱动自动化平台StackStorm

StackStorm简介 StackStorm是一个开源的事件驱动自动化平台,旨在通过自动化工作流来协调和管理IT基础设施、应用程序和服务。它结合了事件监控、反应规则和自动化操作,为DevOps团队提供了一种强大的工具,用于管理…

器→工具, 开源项目 ·

开源的HDFS存储管理系统SSM

SSM(Smart Storage Manager)简介 SSM(Smart Storage Manager)是一个由 Intel 开源的 HDFS 存储管理系统,致力于提供 HDFS 数据的智能管理方案。 SSM 的核心功能 SSM 的核心功能主要围绕数据的智能管理展开,…

器→工具, 开源项目 ·

Python工作流管理系统Snakemake

Snakemake简介 Snakemake是一个用于创建可重现和可扩展的数据分析管道的工作流管理系统。它广泛应用于生物信息学、数据科学和科学研究领域,帮助用户自动化和管理复杂的数据处理任务。Snakemake的设计灵感来自GNU M…

器→工具, 开源项目 ·

命令行数据迁移工具sling-cli

sling-cli 是一个由 SlingDataIO 开发的命令行界面工具,旨在提供便捷的数据操作和管理功能。 sling-cli 简介 项目背景与目的 SlingDataIO 专注于数据集成和数据处理解决方案,sling-cli 是其推出的一款用于简…

器→工具, 开源项目 ·

开源分布式 SQL 查询引擎Trino

Trino简介 Trino(原名PrestoSQL)是一个开源的分布式SQL查询引擎,设计用于对各种数据源进行高速查询。Trino的设计初衷是为了解决大规模数据分析的需求,能够在数据湖、数据仓库和其他数据存储系统上进行交互式分…

器→工具, 开源项目 ·

Python堆栈跟踪信息traceback

Traceback 是在 Python 中与经常遇到,特别是当你代码中有错误时,执行时会返回 Traceback 信息。在学习 Traceback 时,可以一起学习下 trace, tracemalloc。 trace, tracemalloc, 和 traceback 都是 Python 标…

器→工具, 编程语言 ·