分类: 术→技巧

时序相似性计算:从DTW到FastDTW

DTW简介 DTW(Dynamic Time Warping)是一种用于比较时间序列之间相似性的算法。它可以有效地处理在时间轴上存在偏移、缩放和扭曲等变形的时间序列数据。DTW算法通过对两个时间序列进行动态规整,将它们按最优路径…

转化指标波动分析之维度拆解

当一些转化率指标发生波动时,往往需要分析原因,以转化率为例,影响转化率变化的可能因素有: 流量结构发生了变化,部分高转化的渠道或低转化的渠道的流量发生了较大的变化 部分渠道的转化发生了变化 新老客的…

数据, 术→技巧 ·

Hive UDF的开发简介

Hive内置了很多函数,可以参考Hive Built-In Functions。但是有些情况下,这些内置函数还是不能满足我们的需求,这时候就需要UDF出场了。 UDF全称:User-Defined Functions,即用户自定义函数,在Hive SQL编译成Ma…

Facebook Prophet使用与调参实践

针对 Facebook Prophet 的使用,很多年以前就整理过一篇文章《Facebook 时间序列预测工具 fbprophet》,过了 N 年以后当重新需要使用这个工具的时候,发现部分内容已经更新,中间的很多细节内容都没有表述清楚。实…

互联网黑灰产产业链初探

黑灰产的英文翻译是 Black Market,被定义为通过人工方式或者技术手段实施的操纵网络信息内容,获取违法利益、破坏网络生态秩序的行为。对很多人来说,黑灰产的代名词就是“薅羊毛”。实际上,除了薅羊毛,每个行业都…

术→技巧, 运营 ·

JAVA环境:JDK的安装与配置

JAVA开发与运行环境 Java的开发和运行环境是指在进行Java应用程序开发和执行过程中所需的软件和工具。下面分别介绍Java的开发环境和运行环境: Java开发环境(Java Development Environment): JDK(Java …

统计学中的数值变换

我们测得一些数据,要对数据进行分析的时候,会发现数据有一些问题使得我们不能满足我们以前分析方法的一些要求(正态分布、平稳性)为了满足经典线性模型的正态性假设,常常需要使用数值变换,使其转换后的数据接…

数据, 术→技巧 ·

探索性数据分析详解

什么是探索性数据分析? 探索性数据分析(Exploratory Data Analysis,简称EDA)是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探…

数据, 术→技巧 ·

数据可视化之小提琴图

小提琴图(Violin Plot)用于显示数据分布及其概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表95%置信区间,而白点则为中位数…

数据, 术→技巧 ·

Python虚拟环境的创建与管理

为什么要创建虚拟环境? 创建虚拟环境是为了在同一台计算机上,使用不同的Python项目需要的不同版本的Python解释器、第三方库和依赖项,以避免版本冲突和相互影响的问题。虚拟环境是一个独立的Python运行时环境,可…