分类: 术→技巧

Typecho博客系统数据库设计

Typecho是一款仿Wordpress,但相对Wordpress要简单的多的开源博客程序。开发者大量的参考了WordPress的设计,去除了一些高级复杂的功能,实现了一个小而美的博客系统。 Typecho的优点: 轻量高效:仅仅…

术→技巧, 研发 ·

Python连接和使用MongoDB

MongoDB相对于传统的关系型数据库,可以存储JSON数据,非常适合存储数据抓取返回的JSON数据。先前介绍过MongoDB在Windows的安装,今天主要学习的是使用Python连接MongoDB,并进行增删改查的操作。 在连接Mon…

术→技巧, 研发 ·

implicit实现协同过滤实时推荐系统

Implicit简介 Implicit是一个开源的协同过滤项目,其包含多种流行的推荐算法,主要应用场景是针对隐性反馈行为进行推荐。包含的算法主要有: ALS(alternating least squares),最小交替二乘法 BRP(Baye…

Python因子分解库:fastFM

FastFM简介 FastFM的主要特点是将是将因子分解封装成scikit-learn API接口,核心代码使用C编写,性能有一定的保障。 fastFM主要提供了回归、分类、排序三种问题的解决方法。其中对于优化器,有als,mcmc,s…

贝塞尔曲线与B样条曲线

什么是贝塞尔曲线 贝塞尔曲线的数学基础是早在 1912 年就广为人知的伯恩斯坦多项式。但直到 1959 年,当时就职于雪铁龙的法国数学家Paul de Casteljau才开始对它进行图形化应用的尝试,并提出了一种数值稳定的de C…

术→技巧, 研发 ·

Python推荐系统库:Surprise

Surprise简介 Surprise(Simple Python Recommendation System Engine)是一款推荐系统库,是scikit系列中的一个。surprise设计时考虑到以下目的: 让用户完美控制他们的实验。为此,特别强调文档,试图通过…

腾讯视频实时推荐系统实践

前面我们学习了 腾讯Item-based CF实时推荐算法,这篇文章延续同样来自腾讯,介绍的是腾讯实时视频推荐系统的实践。内容来自论文: Real-time Video Recommendation Exploration 这篇论文中的内容。 简介 传统的…

数据, 术→技巧 ·

腾讯Item-based CF实时推荐算法

以下内容主要翻译自2015年腾讯发表的论文 TencentRec: Real-time Stream Recommendation in Practice。对于推荐的搭建还是非常有借鉴意义。 简介 传统的推荐系统通过定期(几小时或几天)分析和更新模型并不能满…

数据, 术→技巧 ·

SciPy稀疏矩阵模块scipy.sparse

稀疏矩阵是指矩阵中的元素大部分是0的矩阵,事实上,实际问题中大规模矩阵基本上都是稀疏矩阵,很多稀疏度在90%甚至99%以上。因此我们需要有高效的稀疏矩阵存储格式。本文总结几种典型的格式:COO,CSR,DIA,ELL,HYB…

PMML,JAVA调用Python算法模型

公司大部分应用的使用的是JAVA开发,要想使用Python模型非常困难,网上搜索了下,可以先将生成的模型转换为PMML文件后即可在JAVA中直接调用。 PMML简介 模型预测标记语言(Predictive Model Markup Language)是…

数据, 术→技巧, 研发 ·