交叉验证方法盘点 在机器学习中,常见有的交叉验证方法有留出法(Holdout cross validation)和k折交叉验证(k-fold cross validation)等,除此之外还有留一法(Leave-One-Out,LOO)、留P法(Leave-P-Out,LPO)…
Statsmodels 和 Scikit-learn 是两个不同的 Python 库,它们都提供了用于线性回归的工具。Statsmodels 中支持的线性回归模型列表: OLS 回归:OLS 代表“普通最小二乘回归”,它是一种最常见且最简单的线性回归模…
线性回归是机器学习中最为简单的模型,但在实际使用过程中可能不太适用。比如以下场景: 分段线性拟合是一种用于对数据进行建模的回归方法,其中数据在不同的区间内使用不同的线性函数进行建模。与简单线性回归…
NeuralProphet 产生背景 大多数时间序列问题需要易于理解的预测。同时,需要有效的预测。这两个愿望导致了一种权衡:可解释性与准确率。准确率的显著提高通常归因于更复杂的模型。然而,复杂性与可解释性存在天然的…
超参数优化简介 目前人工智能和深度学习越趋普及,大家可以使用开源的 Scikit-Learn、TensorFlow 来实现机器学习模型。对于各种模型而言,或多或少都具有要调节的超参数。相同的模型应用在不同的数据集上,如何选择…
DTW简介 DTW(Dynamic Time Warping)是一种用于比较时间序列之间相似性的算法。它可以有效地处理在时间轴上存在偏移、缩放和扭曲等变形的时间序列数据。DTW算法通过对两个时间序列进行动态规整,将它们按最优路径…
当一些转化率指标发生波动时,往往需要分析原因,以转化率为例,影响转化率变化的可能因素有: 流量结构发生了变化,部分高转化的渠道或低转化的渠道的流量发生了较大的变化 部分渠道的转化发生了变化 …
Hive内置了很多函数,可以参考Hive Built-In Functions。但是有些情况下,这些内置函数还是不能满足我们的需求,这时候就需要UDF出场了。 UDF全称:User-Defined Functions,即用户自定义函数,在Hive SQL编译成Ma…
针对 Facebook Prophet 的使用,很多年以前就整理过一篇文章《Facebook 时间序列预测工具 fbprophet》,过了 N 年以后当重新需要使用这个工具的时候,发现部分内容已经更新,中间的很多细节内容都没有表述清楚。实…
黑灰产的英文翻译是 Black Market,被定义为通过人工方式或者技术手段实施的操纵网络信息内容,获取违法利益、破坏网络生态秩序的行为。对很多人来说,黑灰产的代名词就是“薅羊毛”。实际上,除了薅羊毛,每个行业都…