Python字符串模糊匹配库FuzzyWuzzy

在计算机科学中,字符串模糊匹配(fuzzy string matching)是一种近似地(而不是精确地)查找与
标点符
37 sec read

Python短文本分类:LibShortText和TextG…

LibShortText LibShortText是一个开源的Python短文本(包括标题、短信、问题、句子等
标点符
35 sec read

条件随机场(CRF)及CRF++安装使用

CRF简介 CRF是用来标注和划分序列结构数据的概率化结构模型。言下之意,就是对于给定的输出,标识序列Y和观测
标点符
1 min read

使用word2vec训练中文维基百科

word2vec是Google于2013年开源推出的一个用于获取词向量的工具包,关于它的介绍,可以先看词向量工
标点符
1 min read

Python数据可视化之词云wordcloud

Wordcloud是一个生成词云的Python包,可以以词语为基本单位更加直观和艺术的展示文本,呈现效果类似标
标点符
1 min read

北大开源分词工具pkuseg

pkuseg简介 pkuseg是由北京大学语言计算与机器学习研究组研制推出的一套全新的中文分词工具包。pkus
标点符
17 sec read

使用Python进行中文繁简转换

中文繁体、简体的差异,在NPL中类似英文中的大小写,但又比大小写更为复杂,比如同样为繁体字,大陆、香港和台湾又
标点符
18 sec read

SciPy中的稀疏矩阵scipy.sparse

稀疏矩阵是指矩阵中的元素大部分是0的矩阵,事实上,实际问题中大规模矩阵基本上都是稀疏矩阵,很多稀疏度在90%甚
标点符
52 sec read

Python推荐系统库Surprise

Surprise简介 Surprise(Simple Python Recommendation System
标点符
14 sec read

Python因子分解库:fastFM

FastFM简介 FastFM的主要特点是将是将因子分解封装成scikit-learn API接口,核心代码使
标点符
14 sec read

Ubuntu Anaconda Python 3.7安装Fa…

电脑中的Anaconda环境运行在Windows 10的Linux子系统中,昨天在安装fastFM遇到了一些问
标点符
16 sec read

使用implicit搭建实时推荐系统

Implicit简介 Implicit是一个开源的系统过滤项目,其包含多种流行的推荐算法,主要应用场景是针对隐
标点符
19 sec read