什么是Readability? 如果你在网上看到一篇不错的文章想收藏起来稍后再读,却又不想同时保存那一大堆花花绿绿的广告或无关紧要的一些网页元素,那么你可以试试Readability了! Readability是一个颇有特色的“稍后阅…
在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。对数据分库分表后需要有一个唯一ID来标识一条数据或消息,数据库的自增ID显然不能满足需求此时一个能够生成全局唯一ID的系统是非常必要的。概括下来…
什么是信用评分卡模型? 评分卡模型又叫做信用评分卡模型,最早由美国信用评分巨头 FICO 公司于 20 世纪 60 年代推出,在信用风险评估以及金融风险控制领域中广泛使用。银行利用评分卡模型对客户的信用历史数据的多…
什么是超参数? 学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,我们称为参数(Parameter)。还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,我们称为超参数(Hyperparameter)。超…
AIML简介 AIML全名为 Artificial Intelligence Markup Language(人工智能标记语言),是一种创建自然语言软件代理的 XML 语言,是由 Richard S. Wallace 博士和 Alicebot 开源软件组织于 1995-2000 年间发明创造的…
在使用Python处理数据的时候,经常会需要处理Excel中的数据。现在基本上都使用Pandas读取Excel中的数据,但是除了Pandas以外,还有一些Python包可以满足对Excel数据的读取。 在开始之前,先学习下Excel中涉及到…
在开发内容型网站的时候,少不了要接触富文本编辑器。对开发人员来说,全新开发一个富文本编辑器会耗费大量的时间在细节的调整和坑的处理上。在针对内部用户使用的系统中,普遍采用的方式是接入现成的开源编辑器,…
Implicit简介 Implicit是一个开源的协同过滤项目,其包含多种流行的推荐算法,主要应用场景是针对隐性反馈行为进行推荐。包含的算法主要有: ALS(alternating least squares),最小交替二乘法 BRP(Bayesian P…
在使用Python执行一些比较耗时的操作时,为了方便观察进度,通常使用进度条的方式来可视化呈现。Python中的tqdm就是用来实现此功能的。 先来看看tqdm的进度条效果: tqdm基本用法 tqdm最主要的用法有3种,自动…
FastFM 简介 FastFM 的主要特点是将是将因子分解 封装成 scikit-learn API 接口,核心代码使用 C 编写,性能有一定的保障。 fastFM 主要提供了回归、分类、排序三种问题的解决方法。其中对于优化器,有als,mcmc…