分类: 数据

通俗易懂理解数据库概念

在Quora上曾经有个问题: Computer Programming: How would you explain a database in three sentences to your 8-year-old nephew被搬到了知乎上。 来自知乎的答案 中药铺说 电脑里面存了好多好多数据。数据就…

数据, 术→技巧, 研发 ·

使用Excel搭建推荐系统

在上一篇重新认识Excel的文章中,提到了Excel无所不能,然后就想到了曾经看到的这篇关于如何使用Excel搭建推荐引擎的文章。于是找了出来做了下简单的翻译(只翻译了重点部分)。 在互联网上有无限的货架空间,找…

生存分析从概念到实战

先前对于生存分析的理解比较片面,虽然知道生存分析不仅仅适用于预料行业,对于用户留存的也有一定的范围,当时的理解是只适合订阅制的网站用来分析用户留存,但是仔细分析后发现适用场景还是蛮多的。其中个人觉得…

推荐系统之协同过滤

推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究。推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结。 推荐算法概述 …

产品, 数据, 术→技巧 ·

如何定义用户的流失/存活?

定义用户的流失,是一个比较困难的内容。公司的用的流失是按照180天未下单的用户定义的用户流失,追其原因,很多同事说的是行业基准,很少有同事知道这180天是怎么来的。今天就来分析下。 时间锚流失定义法 第一…

数据, 术→技巧, 运营 ·

监督学习与无监督学习

在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域, 主要分为:监督学习,非监督学习,半监督学习和强化学习。监督学习主要用于回归和分类;半监督学习主要用于分类,回归,半监督聚类;…

数据, 术→技巧 ·

浏览器指纹技术简介

日常生活中,生物识别技术已经是多数智能手机的标配,大多数手机具备人脸识别、指纹识别等功能,目前的指纹识别技术已经非常成熟。但我们今天要聊的并不是生物识别技术中的指纹识别,而是浏览器指纹。很多人对这项…

数据, 术→技巧, 研发 ·

汉语拼音正词法基本规则

在听《字谈字畅》节目的时候了解到了一个新的概念:中文拼音正词法。 《中文拼音正词法基本规则》是中华人民共和国国家标准GB/T 16159—1996,1996-01-22国家技术监督局发布,1996-07-01实施。以下为摘录内容…

数据, 术→技巧 ·

机器学习中的欠拟合和过拟合

对于深度学习或机器学习模型而言,我们不仅要求它对训练数据集有很好的拟合(训练误差),同时也希望它可以对未知数据集(测试集)有很好的拟合结果(泛化能力),所产生的测试误差被称为泛化误差。度量泛化能力的…

Scikit-Learn数据集拆分train_test_split

监督机器学习的关键方面之一是模型评估和验证。当您评估模型的预测性能时,过程必须保持公正。为了制作训练数据(training samples)和测试数据(testing samples),常使用sklearn里面的sklearn.model_selection.t…