Pandera简介 Pandera是一个用于验证、清理和文档化Pandas数据框架(DataFrame和Series)的Python库。它提供了基于类型注释的方式来定义数据验证规则,确保数据符合预期格式和约束。这对于数据管道的构建、数据清理…
在前面的文章Python标准库之性能优化 中学习到了统计 Python 代码执行时间的工具。今天要学习的是一些其他的工具。 SnakeViz SnakeViz 简介 SnakeViz 是一个用于可视化 Python 代码性能分析结果的工具。它是基于 Py…
Zeppelin简介 Apache Zeppelin是一个开源的Notebook工具,旨在为数据科学家、数据工程师和分析师提供一个交互式的环境,用于数据探索、可视化和协作分析。它支持多种后端数据处理引擎,使用户能够在一个统一的界面…
Traceback 是在 Python 中与经常遇到,特别是当你代码中有错误时,执行时会返回 Traceback 信息。在学习 Traceback 时,可以一起学习下 trace, tracemalloc。 trace, tracemalloc, 和 traceback 都是 Python 标…
MDX/MDD 文件格式简介 MDX 和 MDD 是字典程序 MDict 使用的文件格式,其中 MDX 文件用于存放定义,而 MDD 用于存放其他资源文件,比如图片,发音,虽然存放的内容是不一样的,但是两种文件的结构是一致的。 MDX 和…
Ren'Py是一个专为创建视觉小说和互动故事而设计的开源引擎。它结合了简易的脚本语言和强大的Python编程功能,使开发者能够创建丰富的叙事体验。 核心特点 易于上手:Ren'Py使用类似于自然语言的脚本语法,降低…
PySpark简介 PySpark是Apache Spark的Python API,它使得Python开发者能够使用Spark的分布式计算能力进行大规模数据处理和分析。PySpark提供了与Scala和Java API类似的功能,并且与Python生态系统(如Pandas、NumPy…
timeit:计时小段代码的执行时间 timeit是Python标准库中的一个模块,用于测量小段代码的执行时间。它提供了一种精确、可靠的方式来对代码的性能进行基准测试,避免了诸如系统时间变化和其他外部因素的影响。timeit…
Sentry简介 Sentry是一个流行的开源实时错误监控工具,主要用于应用程序的日志监控和错误跟踪。它能够帮助开发者快速识别、诊断和修复在生产环境中出现的问题。 以下是Sentry的一些主要特点和功能: 错误捕获…
Logging是Python标准库中自带的日志记录工具,事实上还有很多比它更好第三方日志工具。 logbook Logbook是一个用于替代Python标准库logging模块的日志记录库。它旨在提供更简洁和强大的日志记录接口,改善日志记…