标签: 数据分析

机器学习/数据分析之缺失值处理

在机器学习数据预处理阶段经常需要对数据进行缺失值处理。关于缺失值的处理并没有想象中的那么简单。以下为一些经验分享。 数据缺失类型 完全随机丢失(MCAR,Missing Completely at Random):某个变量是否…

数据, 术→技巧 ·

数据分析之离散度指标

在观察数据的时候离散度是一个重要的指标。通常认为离散度越低数据会越好,但是现实场景并不如此。举个例子,比如某个电商网站有上万的商品,但是其每个商品的点评分离散度较低,那么将用户点评呈现给用户的价值就…

数据, 术→技巧 ·

数据分析应该掌握的SQL技能

以下内容是个人整理的分析人员应该掌握的一些SQL技能,相比正常的SQL教程存在不同的侧重点。 一般查询语句 需要掌握的关键词(包含顺序): SELECT FROM JOIN WHERE GROUP BY HAVING ORDER BY LIMIT S…

数据, 术→技巧 ·