标签: 数据分析

探索性数据分析详解

什么是探索性数据分析? 探索性数据分析(Exploratory Data Analysis,简称EDA) 是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段…

数据, 术→技巧 ·

数据的“有我之境”与“无我之境”

王国维的境界 王国维在《人间词话》中把艺术境界分为“有我之境”与“无我之境”两种: 有我之境: 泪眼问花花不语,乱红飞过千秋去。 可堪孤馆闭春寒,杜鹃声里斜阳暮。 无我之境: 采菊东…

观点, 道→理念 ·

机器学习/数据分析之缺失值处理

在机器学习数据预处理阶段经常需要对数据进行缺失值处理。关于缺失值的处理并没有想象中的那么简单。以下为一些经验分享。 数据缺失类型 完全随机丢失(MCAR,Missing Completely at Random):某个变量是否…

数据, 术→技巧 ·

数据分析之离散度指标

[LATEXPAGE] 在观察数据的时候离散度是一个重要的指标。通常认为离散度越低数据会越好,但是现实场景并不如此。举个例子,比如某个电商网站有上万的商品,但是其每个商品的点评分离散度较低,那么将用户点评呈现…

数据, 术→技巧 ·

数据分析应该掌握的SQL技能

以下内容是个人整理的分析人员应该掌握的一些SQL技能,相比正常的SQL教程存在不同的侧重点。 一般查询语句 需要掌握的关键词(包含顺序): SELECT FROM JOIN WHERE GROUP BY HAVING ORDER BY LIMIT S…

数据, 术→技巧 ·