NLP

斯坦福大学的词向量工具:GloVe

GloVe简介 GloVe的全称叫Global Vectors for Word Representation

CRFPP在Windows环境下的安装

在前面介绍CRF++的文章种,只介绍到了CRFPP在Linux环境下的安装。本周在测试DeepNLP这个工具的

自然语言处理工具之deepnlp

DeepNLP简介 deepnlp项目是基于Tensorflow平台的一个python版本的NLP套装, 目的

自然语言处理之小明NLP

最近在盘点Python下的自然语言处理包,今天发现的这个小明NLP,本身这个工具算是一个比较普通的工具,但中间

自然语言处理之spaCy

spaCy 是一个Python自然语言处理工具包,诞生于2014年年中,号称“Industrial-Stren

自然语言处理工具包之TextBlob

TextBlob简介 TextBlob是一个用Python编写的开源的文本处理库。是自然语言工具包(NLTK)

自然语言处理工具包之NLTK

NLTK简介 NLTK(Natural Language Toolkit)是由宾夕法尼亚大学计算机和信息科学使

中文分词工具盘点之SnowNLP

SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由

黑客马拉松 (Hackathon):POI去重记录

10月24日参加了公司举办的黑客马拉松,我们选的题目是POI的去重。给到的数据格式如下: 目标是去重重复数据。

scikit-learn中的文本特征提取

文本分析是机器学习算法的主要应用领域。由于大部分机器学习算法只能接收固定长度的数值型矩阵特征,导致文本字符串等

斯坦福大学自然语言处理包StanfordNLP

最近在推荐点评的影响抽取,中间涉及到分词后的词性识别,看了各种开源分词工具,主要是词性标注集存在差异,最终选定

中文分词工具盘点:FoolNLTK

FoolNLTK简介 FoolNLTK是一个使用双向 LSTM (BiLSTM 模型)构建的便捷的中文处理工具