数据

相似度计算之Dice系数

Dice距离用于度量两个集合的相似性,因为可以把字符串理解为一种集合,因此Dice距离也会用于度量字符串的相似
18 sec read

相似度计算之闵可夫斯基距离

闵可夫斯基距离又称为闵氏距离(由于翻译问题,有时候也被称为明可夫斯基距离或明氏距离)。闵可夫斯基距离是欧氏空间
28 sec read

相似度计算之切比雪夫距离

切比雪夫距离起源于国际象棋中国王的走法,国际象棋中国王每次只能往周围的8格中走一步,那么如果要从棋盘中A格(x
37 sec read

相似度计算之斯皮尔曼等级相关系数

使用皮尔逊线性相关系数有2个局限:首先,必须假设数据是成对地从正态分布中取得的;其次,数据至少在逻辑范围内是等
24 sec read

相似度计算之汉明距离

汉明距离是以理查德·卫斯里·汉明的名字命名的,汉明在误差检测与校正码的基础性论文中首次引入这个概念这个所谓的距
2 sec read

相似度计算之曼哈顿距离

曼哈顿距离是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种使用在几何度量空间的几何学用语,用以标明两个点在标准
4 sec read

相似度计算之杰卡德相似度

Jaccard index, 又称为Jaccard相似系数(Jaccard similarity coeffi
30 sec read

相似度计算之皮尔逊相关系数

在统计学中,皮尔逊相关系数相关系数(英语:Pearson product-moment correlation
1 min read

相似度计算之余弦相似度

在推荐系统中常常会计算相似度的问题,其中最常见的是采用余弦相似度的方式进行计算,今天就一起来学习下余弦相似度,
36 sec read

相似度计算之欧几里得距离

在数学中,欧几里得距离或欧几里得度量是欧几里得空间中两点间“普通”(即直线)距离。欧几里得距离有时候有称欧氏距
16 sec read

Python数据分析学习笔记:Numpy(三)

统计函数 NumPy 有很多有用的统计函数,用于从数组中给定的元素中查找最小,最大,百分标准差和方差等。 函数
1 min read

Python数据分析学习笔记:Numpy(二)

切片和索引 ndarray对象的内容可以通过索引或切片来访问和修改,就像 Python 的内置容器对象一样。如
2 min read