法→原理 – 第 6 页

分类：法→原理

生存分析从概念到实战

先前对于生存分析的理解比较片面，虽然知道生存分析不仅仅适用于预料行业，对于用户留存的也有一定的范围，当时的理解是只适合订阅制的网站用来分析用户留存，但是仔细分析后发现适用场景还是蛮多的。其中个人觉得…

数据, 术→技巧, 机器学习, 法→原理 · 2022-10-29

模糊C聚类算法Fuzzy C-Means

Fuzzy C-Means简介模糊理论模糊控制是自动化控制领域的一项经典方法。其原理则是模糊数学、模糊逻辑。1965，L.A. Zadeh发表模糊集合“Fuzzy Sets”的论文，首次引入隶属度函数的概念，打破了经典数学“非0即1”的局限…

机器学习, 法→原理, 算法实现 · 2022-09-10

机器学习中的欠拟合和过拟合

对于深度学习或机器学习模型而言，我们不仅要求它对训练数据集有很好的拟合（训练误差），同时也希望它可以对未知数据集（测试集）有很好的拟合结果（泛化能力），所产生的测试误差被称为泛化误差。度量泛化能力的…

数据, 术→技巧, 机器学习, 法→原理 · 2022-07-29

大数据通识：HIVE

Hive简介 Hive由Facebook实现并开源，是基于Hadoop的一个数据仓库工具。可以将结构化的数据映射为一张数据库表并提供HQL(Hive SQL)查询功能。底层数据是存储在HDFS上，Hive的本质是将SQL语句转换为MapReduce任务运…

数据, 术→技巧, 法→原理 · 2022-01-14

大数据通识：Google MapReduce

Google，作为全球最大的搜索引擎公司，其伟大之处不仅在于建立了一个强大的搜索引擎，还在于它创造了3项革命性的技术，即：GFS、MapReduce和BigTable。作为Google早期三驾马车，这三项革命性的技术不仅在大数据领域…

数据, 术→技巧, 法→原理 · 2022-01-05

大数据通识：Google BigTable

Bigtable是2005年谷歌的论文：《Bigtable: A Distributed Storage System for Structured Data》中介绍的一种分布式存储系统，后来被Hadoop社区实现为HBase。读懂这篇论文，那么理解HBase也就非常容易了。摘要（…

数据, 术→技巧, 法→原理 · 2022-01-01

大数据通识：Google GFS

GFS系统简介 Google文件系统（Google File System，缩写为GFS或Google FS），一种由Google公司开发专有分布式文件系统。它与传统文件系统的的区别在于：分布式 - 提供很高的横向扩展性使用大量廉价的普通…

数据, 术→技巧, 法→原理 · 2022-01-01

Learning to Rank算法学习之GBRank

GBRank是一种pair-wise的学习排序算法，他是基于回归来解决pair对的先后排序问题。在GBRank中，使用的回归算法是梯度提升数GBT (Gradient Boosting Tree) 算法原理 Learning To Rank需要解决的问题是给定一个Query…

数据, 术→技巧, 机器学习, 法→原理 · 2021-07-22

推荐系统：从千人千面到千域千面

谈到推荐系统，很多人的印象中是“个人性推荐”和“千人千面”。关于“千域千面”应该很少人提及，主要能用到的场景不多，先前有想过在酒店场景上应用，但是由于各种原因最终没有尝试。以下是高德地图在“千域千面”的一些…

数据, 术→技巧, 机器学习 · 2021-07-21

主题模型LDA(Latent Dirichlet Allocation)初探

在潜在语义分析LSA的文章中对LDA有一些简单的介绍，今天的目标是对LDA进行相对深入的了解，大致搞明白其原理。 LDA简介在机器学习领域中有2个LDA：线性判别分析(Linear Discriminant Analysis)，主要用于降维和…

数据, 术→技巧, 机器学习, 法→原理, 自然语言处理 · 2021-07-17

分类目录

分类：法→原理

生存分析从概念到实战

模糊C聚类算法Fuzzy C-Means

机器学习中的欠拟合和过拟合

大数据通识：HIVE

大数据通识：Google MapReduce

大数据通识：Google BigTable

大数据通识：Google GFS

Learning to Rank算法学习之GBRank

推荐系统：从千人千面到千域千面

主题模型LDA(Latent Dirichlet Allocation)初探

热门文章：

机器学习算法之Boosting

Facebook Prophet使用与调参实践

机器学习算法之LightGBM

密度聚类算法之OPTICS

机器学习算法之XGBoost

时序相似性计算：从DTW到FastDTW

推荐算法之矩阵分解

相关性分析：Pearson、Kendall、Spearman

机器学习聚类算法之Mean Shift

分类： 法→原理

热门文章：

分类：法→原理