分类: 术→技巧

Python全角/半角字符互转

在文本处理的时候,经常会遇到全角半角不一致的问题。于是需要程序能够快速的在两者之间互转。 由于全角半角本身存在着映射关系,所以处理起来并不复杂。具体规则为: 全角字符unicode编码从65281~65374(十六…

术→技巧, 研发 ·

Python 多线程与多进程

在学习Python的过程中,有接触到多线程编程相关的知识点,先前一直都没有彻底的搞明白。今天准备花一些时间,把里面的细节尽可能的梳理清楚。 线程与进程的区别 进程(process)和线程(thread)是操作系统的基本概…

Typecho博客系统数据库设计

Typecho是一款仿Wordpress,但相对Wordpress要简单的多的开源博客程序。开发者大量的参考了WordPress的设计,去除了一些高级复杂的功能,实现了一个小而美的博客系统。 Typecho的优点: 轻量高效:仅仅7张数据…

术→技巧, 研发 ·

Python连接和使用MongoDB

MongoDB相对于传统的关系型数据库,可以存储JSON数据,非常适合存储数据抓取返回的JSON数据。先前介绍过MongoDB在Windows的安装,今天主要学习的是使用Python连接MongoDB,并进行增删改查的操作。 在连接MongoDB…

术→技巧, 研发 ·

implicit实现协同过滤实时推荐系统

Implicit简介 Implicit是一个开源的协同过滤项目,其包含多种流行的推荐算法,主要应用场景是针对隐性反馈行为进行推荐。包含的算法主要有: ALS(alternating least squares),最小交替二乘法 BRP(Bayesian P…

Python因子分解库:fastFM

FastFM 简介 FastFM 的主要特点是将是将因子分解 封装成 scikit-learn API 接口,核心代码使用 C 编写,性能有一定的保障。 fastFM 主要提供了回归、分类、排序三种问题的解决方法。其中对于优化器,有als,mcmc…

贝塞尔曲线与B样条曲线

什么是贝塞尔曲线 贝塞尔曲线的数学基础是早在1912年就广为人知的伯恩斯坦多项式。但直到1959年,当时就职于雪铁龙的法国数学家Paul de Casteljau才开始对它进行图形化应用的尝试,并提出了一种数值稳定的de Castel…

术→技巧, 研发 ·

Python推荐系统库:Surprise

Surprise简介 Surprise(Simple Python Recommendation System Engine)是一款推荐系统库,是scikit系列中的一个。surprise设计时考虑到以下目的: 让用户完美控制他们的实验。为此,特别强调文档,试图通过指出…

腾讯视频实时推荐系统实践

前面我们学习了腾讯Item-based CF实时推荐算法,这篇文章延续同样来自腾讯,介绍的是腾讯实时视频推荐系统的实践。内容来自论文: Real-time Video Recommendation Exploration 这篇论文中的内容。 简介 传统的技术…

数据, 术→技巧 ·

腾讯Item-based CF实时推荐算法

以下内容主要翻译自2015年腾讯发表的论文 TencentRec: Real-time Stream Recommendation in Practice。对于推荐的搭建还是非常有借鉴意义。 简介 传统的推荐系统通过定期(几小时或几天)分析和更新模型并不能满足…

数据, 术→技巧 ·