在前面的文章Python标准库之性能优化 中学习到了统计 Python 代码执行时间的工具。今天要学习的是一些其他的工具。 SnakeViz SnakeViz 简介 SnakeViz 是一个用于可视化 Python 代码性能分析结果的工具。它是基于 Py…
gRPC简介 gRPC是一个现代化的、高性能的远程过程调用(Remote Procedure Call, RPC)框架,由Google开发并开源。它基于HTTP/2协议,使用Protocol Buffers(protobuf)作为接口定义语言(IDL)和数据序列化工具,是…
dbt简介 dbt (data build tool)是一个开源的数据转换和建模工具,由 dbt Labs 开发和维护。dbt 旨在简化数据仓库中的数据转换和建模过程,帮助数据工程师和分析师高效地管理和执行数据管道。dbt 核心(dbt-core)是…
Zeppelin简介 Apache Zeppelin是一个开源的Notebook工具,旨在为数据科学家、数据工程师和分析师提供一个交互式的环境,用于数据探索、可视化和协作分析。它支持多种后端数据处理引擎,使用户能够在一个统一的界面…
StackStorm简介 StackStorm是一个开源的事件驱动自动化平台,旨在通过自动化工作流来协调和管理IT基础设施、应用程序和服务。它结合了事件监控、反应规则和自动化操作,为DevOps团队提供了一种强大的工具,用于管理…
SSM(Smart Storage Manager)简介 SSM(Smart Storage Manager)是一个由 Intel 开源的 HDFS 存储管理系统,致力于提供 HDFS 数据的智能管理方案。 SSM 的核心功能 SSM 的核心功能主要围绕数据的智能管理展开,…
Snakemake简介 Snakemake是一个用于创建可重现和可扩展的数据分析管道的工作流管理系统。它广泛应用于生物信息学、数据科学和科学研究领域,帮助用户自动化和管理复杂的数据处理任务。Snakemake的设计灵感来自GNU M…
sling-cli 是一个由 SlingDataIO 开发的命令行界面工具,旨在提供便捷的数据操作和管理功能。 sling-cli 简介 项目背景与目的 SlingDataIO 专注于数据集成和数据处理解决方案,sling-cli 是其推出的一款用于简…
Trino简介 Trino(原名PrestoSQL)是一个开源的分布式SQL查询引擎,设计用于对各种数据源进行高速查询。Trino的设计初衷是为了解决大规模数据分析的需求,能够在数据湖、数据仓库和其他数据存储系统上进行交互式分…
Traceback 是在 Python 中与经常遇到,特别是当你代码中有错误时,执行时会返回 Traceback 信息。在学习 Traceback 时,可以一起学习下 trace, tracemalloc。 trace, tracemalloc, 和 traceback 都是 Python 标…