钱魏Way

650篇文章

网关协议CGI、FastCGI、WSGI的区别

在部署PHP和Python的WEB应用时,会遇到类似CGI、FastCGI、WSGI、uWSGI等概念。先前对这些概念一直很疑惑,不知道该如何选择。于是抽时间对这部分内容进行了梳理,以下为主要内容: CGI CGI即通用网关接口(Common …

术→技巧, 研发 ·

短文本匹配实战:重复POI识别

项目需求 去除从地图网站抓取的POI数据中的重复数据。示例数据如下: 思考逻辑 POI去重问题,并非简单的文本匹配,按照编辑距离去做,可能会走到沟里去。 不同地方有相同名字的POI点,如: 行政管理…

数据, 术→技巧 ·

Matplotlib中文乱码解决方案

在使用matplotlib默认情况会出现乱码问题,原则上matplotlib是支持中文的,只是在配置信息里没有中文字体的相关信息。 Windows下中文乱码解决方案 解决方案一:修改配置文件 matplotlib 从配置文件 matplotl…

器→工具, 工具软件 ·

Elasticsearch中文分词插件安装

Elasticsearch分析器原理 在安装分词工具前我们需要先了解下一个概念:分析器(Analyzer)。分析器是三个顺序执行的组件的结合(字符过滤器,分词器,标记过滤器)。即分词器包含在分析器中。分析器的内部就是一条…

Linux终端文件类型与颜色

在使用ls 命令时,可以发现不同类型的文件,颜色不同,具体每种颜色代表哪类文件?今天就一起来学习下。 默认情况下,在命令行中输入dircolors 即可了解到具体的配置信息: [root@localhost ~]# dircolors …

器→工具, 工具软件 ·

Linux软件安装命令,CMMI流程

在自行安装编译Linux软件过程中会执行三个步骤:./configure,make,make install。这三个步骤在安装过程中到底起到什么作用,先前一直糊里糊涂的,今天就来一起学习下。 ./configure(配置) configure会根据当…

器→工具, 工具软件 ·

Linux防火墙FirewallD与iptables

CentOS从7.0 开始将原先的防火墙iptables换成了FirewallD。FirewallD支持 IPv4, IPv6 防火墙设置以及以太网桥接,并且拥有运行时配置和永久配置选项,被称作动态管理防火墙,也就是说不需要重启整个防火墙便可应用…

器→工具, 工具软件 ·

Linux定时任务 Crontab

crond是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务工具,并且会自动启动crond进程,crond进程每分钟会定期检查是否有…

器→工具, 工具软件 ·

Linux系统启动速度优化工具systemd-analyze

systemd-analyze简介 systemd-analyze是Linux自带的分析系统启动性能的工具。 systemd-analyze可使用的命令: systemd-analyze [OPTIONS...] [time] systemd-analyze [OPTIONS...] blame system…

器→工具, 工具软件 ·

FFM/libffm在Windows/Linux上的安装使用

FFM 的作者Yu-Chin Juan在GitHub上开源了C++版本的代码libffm,由于日常的数据处理都是Python环境,所以期望能找到Python版本的FFM。相关的项目Github上有很多,比如这个:A Python wrapper for LibFFM。 Wind…

器→工具, 工具软件 ·