分类: 数据

Facebook Prophet使用与调参实践

针对Facebook Prophet的使用,很多年以前就整理过一篇文章《Facebook时间序列预测工具fbprophet》,过了N年以后当重新需要使用这个工具的时候,发现部分内容已经更新,中间的很多细节内容都没有表述清楚。实际使用…

统计学中的数值变换

我们测得一些数据,要对数据进行分析的时候,会发现数据有一些问题使得我们不能满足我们以前分析方法的一些要求(正态分布、平稳性)为了满足经典线性模型的正态性假设,常常需要使用数值变换,使其转换后的数据接…

数据, 术→技巧 ·

探索性数据分析详解

什么是探索性数据分析? 探索性数据分析(Exploratory Data Analysis,简称EDA) 是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段…

数据, 术→技巧 ·

数据可视化之小提琴图

小提琴图 (Violin Plot) 用于显示数据分布及其概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表 95% 置信区间,而白点则为中…

数据, 术→技巧 ·

通俗易懂理解数据库概念

在Quora上曾经有个问题: Computer Programming: How would you explain a database in three sentences to your 8-year-old nephew被搬到了知乎上。 来自知乎的答案 中药铺说 电脑里面存了好多好多数据。数据就…

数据, 术→技巧, 研发 ·

使用Excel搭建推荐系统

在上一篇重新认识Excel的文章中,提到了Excel无所不能,然后就想到了曾经看到的这篇关于如何使用Excel搭建推荐引擎的文章。于是找了出来做了下简单的翻译(只翻译了重点部分)。 在互联网上有无限的货架空间,找…

生存分析从概念到实战

先前对于生存分析的理解比较片面,虽然知道生存分析不仅仅适用于预料行业,对于用户留存的也有一定的范围,当时的理解是只适合订阅制的网站用来分析用户留存,但是仔细分析后发现适用场景还是蛮多的。其中个人觉得…

推荐系统之协同过滤

推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究。推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结。 推荐算法概述 …

产品, 数据, 术→技巧 ·

如何定义用户的流失/存活?

定义用户的流失,是一个比较困难的内容。公司的用的流失是按照180天未下单的用户定义的用户流失,追其原因,很多同事说的是行业基准,很少有同事知道这180天是怎么来的。今天就来分析下。 时间锚流失定义法 第一…

数据, 术→技巧, 运营 ·

监督学习与无监督学习

在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域, 主要分为:监督学习,非监督学习,半监督学习和强化学习。监督学习主要用于回归和分类;半监督学习主要用于分类,回归,半监督聚类;…

数据, 术→技巧 ·