自然语言处理工具包之TextBlob

TextBlob简介

TextBlob是一个用Python编写的开源的文本处理库。是自然语言工具包(NLTK)库的一个包装器,目的是抽象其复杂性。它可以用来执行很多自然语言处理的任务,比如,词性标注,名词性成分提取,情感分析,文本翻译,等等。

主要特性:

  • 名词短语提取
  • 词性标记
  • 情绪分析
  • 分类
  • 由 Google 翻译提供的翻译和检测
  • 标记(将文本分割成单词和句子)
  • 词句、短语频率
  • 解析
  • n-gram
  • 词变化(复数和单数化)和词形化
  • 拼写校正
  • 通过扩展添加新模型或语言
  • WordNet 集成

TextBlob的安装

直接执行 pip install textblob 即可进行安装。但是执行如下代码可能会报错:

解决方案是,安装好nltk,并下载好nltk_data。

TextBlob的使用

参考链接:

微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

Python检验数据是否正态分布

判断数据是否符合正态分布,比如使用3-sigma判断数据异常前,首先需要确定的是数据是否符合正态分布。今天一起

数据探索Pandas-Profiling与Dataprep.…

在使用数据前,我们首先要做的事观察数据,包括查看数据的类型、数据的范围、数据的分布等。Pandas-Profi

开源指标可视化工具Graphite

Graphite 是处理可视化和指标数据的优秀开源工具。它有强大的查询 API 和相当丰富的插件功能设置。事实

发表评论

电子邮件地址不会被公开。 必填项已用*标注