All Stories

Python检验数据是否正态分布

判断数据是否符合正态分布,比如使用3-sigma判断数据异常前,首先需要确定的是数据是否符合正态分布。今天一起

数据探索Pandas-Profiling与Dataprep.…

在使用数据前,我们首先要做的事观察数据,包括查看数据的类型、数据的范围、数据的分布等。Pandas-Profi

开源指标可视化工具Graphite

Graphite 是处理可视化和指标数据的优秀开源工具。它有强大的查询 API 和相当丰富的插件功能设置。事实

相关性分析之Predictive Power Score(P…

常用相关性分析方法 在分析特征间相关性时,常使用的方法是pandas.DataFrame.corr: Data

社区版Skyline CentOS 7部署记录

异常监控系统Skyline的文章中,详细介绍了Skyline的架构,今天主要分享的是自己在部署Skyline中

层次聚类改进算法之Chameleon

Chameleon简介 Chameleon(变色龙)算法是一种两阶段层次聚类算法。在进行两个类簇合并时使用更高

层次聚类改进算法之CURE

CURE(Clustering Using Representatives)是一种针对大型数据库的高效的聚类算

层次聚类改进算法之BIRCH

BIRCH算法简介 BIRCH算法的全称是Balanced Iterative Reducing and Cl

聚类算法之层次聚类

层次聚类简介 层次聚类算法(Hierarchical Clustering)将数据集划分为一层一层的clust

酒店收益管理:解决方案,最佳实践,收益经理角色

挤满了人的酒店并不总是盈利的酒店。酒店业成功的标志是收入。酒店采用各种收入管理技术和策略,旨在提高利润。 与航

基于供需的Airbnb动态定价策略

什么是Airbnb动态定价 所谓的Airbnb动态定价其实就是根据市场上的供应需求调整Airbnb上房价的单位

使用Python检测符号及乱码字符

最近在进行关键词的分析,中间涉及到对一些特殊的字符进行过滤的需求。包括带符号的(有部分还是SQL注入),并且存