数据

Python检验数据是否正态分布

判断数据是否符合正态分布,比如使用3-sigma判断数据异常前,首先需要确定的是数据是否符合正态分布。今天一起

数据探索Pandas-Profiling与Dataprep.…

在使用数据前,我们首先要做的事观察数据,包括查看数据的类型、数据的范围、数据的分布等。Pandas-Profi

开源指标可视化工具Graphite

Graphite 是处理可视化和指标数据的优秀开源工具。它有强大的查询 API 和相当丰富的插件功能设置。事实

相关性分析之Predictive Power Score(P…

常用相关性分析方法 在分析特征间相关性时,常使用的方法是pandas.DataFrame.corr: Data

社区版Skyline CentOS 7部署记录

异常监控系统Skyline的文章中,详细介绍了Skyline的架构,今天主要分享的是自己在部署Skyline中

层次聚类改进算法之Chameleon

Chameleon简介 Chameleon(变色龙)算法是一种两阶段层次聚类算法。在进行两个类簇合并时使用更高

层次聚类改进算法之CURE

CURE(Clustering Using Representatives)是一种针对大型数据库的高效的聚类算

层次聚类改进算法之BIRCH

BIRCH算法简介 BIRCH算法的全称是Balanced Iterative Reducing and Cl

聚类算法之层次聚类

层次聚类简介 层次聚类算法(Hierarchical Clustering)将数据集划分为一层一层的clust

Folium绘制Choropleth分级着色图

在上一篇Folium的文章中,针对Choropleth的使用有过简单的介绍,但是对于如何调整分级样式图等,没有

如何正确设置直方图中的bins值

不管使用matplotlib.pyplot.hist或是pandas.DataFrame.hist最终调用的是

时间序列异常检测实战:酒店价格

先前的文章讲到的一些基于时间序列异常检测方法。今天找到了一篇实战文章,在此翻译下,供研究。 数据准备 这里使用