All Stories

GeoHash与商圈高效匹配

最近在研究商圈相关的数据分析,遇到的最大的麻烦是商圈数据的缺失。核心的原因是的没有一份完善的商圈数据。这里先不

信息熵在会员营销中的应用思考

在短信营销场景中,常常会遇到有些用户你给他发多少条促销短信他都无动于衷。针对这样的情况,通常我们会将这类用户称

机器学习之特征选择

特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗

深入理解最大互信息系数

最大互信息系数简介 互信息Mutual Information(MI)是用来评价一个事件的出现对于另一个事件的

Linux下Matplotlib中文显示问题

关于Matplotlib画图出现的中文显示为方框的问题,网上的很多解决方案是针对Windows系统的:

假设检验之卡方检验

假设检验简介 假设检验(Hypothesis Testing),或者叫做显著性检验(Significance

使用Python绘制柱形竞赛图

我们经常看到的Bar Chart Race(柱形竞赛图),可以看到数据的呈现非常的直观。今天就一起来学习下如何

时间序列趋势判断

判断时间序列数据是上升还是下降是我们常见的问题。比如某个股票在过去一年整体趋势是上升还是下降。我们可以通过画图

WordPress LaTeX插件更换记录

由于自己的博客要插入很多的公式,所以需要依赖LaTeX插件来帮忙实现。先前一直使用的是WP QuickLaTe

学会这些原则,成为自己的创始人

同程商学院第一课:《学会这些原则,成为自己的创始人》学习心得: 一、销售思维:“我能帮你做什么”->“我

聚类算法之Affinity Propagation(AP)

Affinity Propagation算法简介 AP(Affinity Propagation)通常被翻译为

机器学习算法之朴素贝叶斯

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素贝叶斯分类是贝叶斯分类