分类: 工具软件

腾讯自然语言工具TexSmart

TexSmart 简介 TexSmart是由腾讯人工智能实验室的自然语言处理团队开发的一套自然语言理解工具与服务,用以对中文和英文两种语言的文本进行词法、句法和语义分析。除了支持分词、词性标注、命名实体识别(NER)、句…

器→工具, 工具软件 ·

条件随机场CRF及CRF++安装与使用

条件随机场(conditional random field, CRF)是用来标注和划分序列结构数据的概率化结构模型。言下之意,就是对于给定的输出,标识序列Y和观测序列X,条件随机场通过定义条件概率P(Y|X),而不是联合概率分布P(X,Y)来…

Linux下文件的压缩与解压缩

Linux下文件的压缩与解压缩与Windows环境下有较大的区别,在Windows下只需要安装类似Winrar工具就能解压缩大部分文件,而在Linux命令行下每一种文件都有不同的压缩和解压缩方法。 常用Linux压缩解压缩命令 使用ta…

器→工具, 工具软件 ·

自然语言处理工具包之NLTK

NLTK简介 NLTK (Natural Language Toolkit)是由宾夕法尼亚大学计算机和信息科学使用 python 语言实现的一种自然语言工具包,其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-…

器→工具, 工具软件 ·

Docker安装多用户版JupyterHub

宿主服务器使用的是 Ubuntu 18.04,需要注意的是 Docker 目前不支持 Ubuntu 19.10。如要在 19.10 中使用 Docker 需要在 Docker 源配置时设置 Ubuntu 18.04 的版本标识:bionic。 deb [arch=amd64] https://download…

器→工具, 工具软件 ·

Elasticsearch学习笔记:简介

Elasticsearch 是一个基于Apache Lucene (TM) 的开源搜索引擎。无论在开源还是专有领域,Lucene 可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。但是,Lucene 只是一个库。想要使用它,你必须使用…

器→工具, 工具软件 ·

MySQL分支的选择:Percona还是MariaDB

在MySQL被Oracle收购以后,越来越多的人对于MySQL的前景表示了担忧,对于开源的MySQL,或多或少对于Oracle自家的数据库产品产生冲击,这个开源免费的MySQL对于Oracle更多的是包袱而不是资产。比如淘宝就从Oracle转…

器→工具, 工具软件 ·

MySQL与PostgreSQL哪个更好?

网上已经有很多拿PostgreSQL与MySQL比较的文章了,这篇文章只是对一些重要的信息进行下梳理。在开始分析前,先来看下这两张图: MySQL MySQL声称自己是最流行的开源数据库。LAMP中的M指的就是MySQL。构建在LAMP…

器→工具, 工具软件 ·

Matplotlib 点、线形状及颜色

在Python中经常使用matplotlib画图,为了让图像显示的更加好看,经常需要对图表点、线形状及颜色进行设置。为了避免遗忘,整理相关的信息。 先来看看matplotlib画图方法的官方说明: from matplotlib import pyplo…

Linux安装之swap交换分区大小设置

Linux中Swap(即:交换分区),类似于Windows的虚拟内存,就是当内存不足的时候,把一部分硬盘空间虚拟成内存使用,从而解决内存容量不足的情况。 在安装Linux系统的时候需要单独设置swap分区而Windows安装没有此…

器→工具, 工具软件 ·