机器学习 – 第 5 页

分类：机器学习

分类算法评估指标

Confusion Matrix混淆矩阵在机器学习领域，混淆矩阵（confusion matrix），又称为可能性表格或是错误矩阵。它是一种特定的矩阵用来呈现算法性能的可视化效果，通常是监督学习（非监督学习，通常用匹配矩阵：matchi…

数据, 术→技巧, 机器学习, 法→原理 · 2020-09-23

机器学习算法之K-近邻（KNN）

什么是K-近邻算法？ K近邻法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理是：存在一个样本数据集合，也称作为训练样本集，并且样本集中每个数据都存在标签，即…

数据, 术→技巧, 机器学习, 法→原理 · 2020-09-23

机器学习聚类算法之HDBSCAN

先前的文章中介绍了基于密度的聚类方法DBSCAN，今天要学习的是 HDBSCAN。单从名字上看，两者必然存在一定的关系。我们先来看看官方的介绍： HDBSCAN - Hierarchical Density-Based Spatial Clustering of Applicati…

数据, 术→技巧, 机器学习, 法→原理 · 2020-09-16

密度聚类算法之OPTICS

在前面介绍的DBSCAN算法中，有两个初始参数Eps（邻域半径）和minPts(Eps邻域最小点数)需要手动设置，并且聚类的结果对这两个参数的取值非常敏感，不同的取值将产生不同的聚类结果。为了克服DBSCAN算法这一缺点，提…

数据, 术→技巧, 机器学习, 法→原理 · 2020-09-16

机器学习聚类算法之DBSCAN

K-Means算法和MeanShift算法都是基于距离的聚类算法，基于距离的聚类算法的聚类结果是球状的簇，当数据集中的聚类结果是非球状结构时，基于距离的聚类算法的聚类效果并不好。与基于距离的聚类算法不同的是，基…

数据, 术→技巧, 机器学习, 法→原理 · 2020-09-16

机器学习聚类算法之ISODATA

ISODATA算法（Iterative Self Organizing Data Analysis Techniques Algorithm，迭代自组织数据分析方法）和K-Means算法是相似的算法，都是属于无监督的聚类分析方法，但是在之前介绍的K-Means算法中，有两大缺陷…

机器学习, 法→原理 · 2020-09-16

聚类实战：一维数组数据聚类

大部分聚类方法针对的是多维数据，现实场景中还有可能存在以为数据的情况，针对以为数组的聚类和多维的数据有很大的不同，今天就来实战演练下：需求内容：分析订单的价格分布常见方案：按照100为梯度，分析不…

数据, 术→技巧, 机器学习, 法→原理 · 2020-09-16

聚类算法评估指标

在学习聚类算法得时候并没有涉及到评估指标，主要原因是聚类算法属于非监督学习，并不像分类算法那样可以使用训练集或测试集中得数据计算准确率、召回率等。那么如何评估聚类算法得好坏呢？好的聚类算法,一般要求类…

数据, 术→技巧, 机器学习, 法→原理 · 2020-09-16

异常监控系统之Skyline与Oculus

Kale系统是Etsy公司开源的一个监控分析系统。Kale分为两个部分：skyline和oculus。skyline负责对时序数据进行概率分布校验，对校验失败率超过阈值的时序数据发报警，oculus负责给被报警的时序，找出趋势相似的其他…

器→工具, 开源项目, 机器学习, 法→原理 · 2020-09-16

关联分析算法之FP-Growth

在Apriori算法的学习中，我们了解到Apriori算法需要不断生成候选项目队列和不断得扫描整个数据库进行比对，I/O是很大的瓶颈。为了解决这个问题，FP-Growth利用了巧妙的数据结构，无论多少数据，只需要扫描两次数据…

数据, 术→技巧, 机器学习, 法→原理 · 2020-09-15

分类目录

分类：机器学习

分类算法评估指标

机器学习算法之K-近邻（KNN）

机器学习聚类算法之HDBSCAN

密度聚类算法之OPTICS

机器学习聚类算法之DBSCAN

机器学习聚类算法之ISODATA

聚类实战：一维数组数据聚类

聚类算法评估指标

异常监控系统之Skyline与Oculus

关联分析算法之FP-Growth

热门文章：

机器学习算法之Boosting

Facebook Prophet使用与调参实践

机器学习算法之LightGBM

密度聚类算法之OPTICS

机器学习算法之XGBoost

推荐算法之矩阵分解

相关性分析：Pearson、Kendall、Spearman

机器学习聚类算法之Mean Shift

风险控制：信用评分卡模型

分类： 机器学习

热门文章：

分类：机器学习