分类: 术→技巧

数据处理方法ETL与ELT的区别

ETL(Extract, Transform, Load)和ELT(Extract, Load, Transform)是两种常见的数据集成方法,它们在数据处理的顺序上存在显著差异。 ETL(提取、转换、加载) 过程:首先从各种数据源中提取数据,然后对这些…

数据, 术→技巧 ·

如何高效的执行PDCA循环

什么是PDCA? PDCA循环,又称戴明环(Deming Cycle),是一种用于持续改进流程和解决问题的管理方法。PDCA代表计划(Plan)、执行(Do)、检查(Check)和行动(Act)四个阶段。这一方法被广泛应用于质量管理、项…

术→技巧, 管理 ·

异常根因分析方法Adtributor

Adtributor算法简介 Adtributor算法是由微软研究院在2014年提出的一种用于多维时间序列异常根因分析的方法。它主要用于解决以下问题:当某个关键性能指标(KPI)发生异常波动时,如何快速准确地找出导致该异常的根本…

数据, 术→技巧 ·

指标波动归因贡献率计算

指标波动贡献率 指标波动贡献率是一种用于分析和衡量不同因素对某一指标变动影响的统计方法。它在经济学、金融学、市场分析以及其他领域中被广泛应用。通过分析指标波动贡献率,可以更好地理解各个因素在指标变动中…

数据, 术→技巧 ·

前端技术WebAssembly的初探

什么是 WebAssembly? WebAssembly(简称 Wasm)是一种用于在 Web 浏览器中运行二进制代码的技术。它是由 W3C WebAssembly 工作组开发的开放标准,旨在提供一种高效、安全的方式来在浏览器中执行代码。WebAssembly …

术→技巧, 研发 ·

Python数据可视化工具bokeh

Bokeh简介 Bokeh是一个用于创建交互式和可视化丰富的web应用程序的Python库。它专为需要在现代Web浏览器中呈现复杂数据可视化的场景而设计,旨在帮助数据科学家、分析师和开发人员以简洁的方式创建高效和动态的数…

Python开源搜索引擎库Whoosh

Whoosh简介 Whoosh是一个用纯Python编写的开源搜索引擎库,专为实现快速和高效的全文搜索而设计。它不依赖于外部库或服务,易于嵌入到Python应用程序中,适合需要全文索引和搜索功能的场景。Whoosh的设计灵活且易于…

术→技巧, 研发 ·

PostgreSQL多版本并发控制MVCC

多版本并发控制(MVCC,Multi-Version Concurrency Control)是PostgreSQL中实现并发控制的一种机制。MVCC允许多个事务同时访问数据库,而不会产生锁定冲突。这种机制通过维护数据的多个版本,提供了一种高效的方法…

术→技巧, 研发 ·

技术选型:选择无聊的技术

新技术总是让工程师兴奋不已。新的编程范式、新的编程语言、不同的库、不同的数据库。我们总是在寻找新奇并渴望学习,但用户并不关心你的公司使用什么技术。只要你的产品有效,他们就会很高兴。 《Choose Boring T…