分类: 术→技巧

Python模块:容器数据类型Collections

在 Python 中有一些内置的数据类型,比如 int, str, list, tuple, dict 等。Python 的 collections 模块在这些内置数据类型的基础上,提供了几个额外的数据类型: namedtuple() 生成可以使用名字来访问元素内…

C语言:基本数据类型

在C语言中,每个变量在使用之前必须定义其数据类型。C语言有以下几种类型:整型(int)、浮点型(float)、字符型(char)、指针型(*)、无值型(void)以及结构(struct)和联合(union)。其中前五种是C的基本数据类型、后两种数…

C语言:预处理器与宏

编译一个C程序包含很多步骤,其中第一个步骤被称为预处理阶段。C预处理器在源代码编译之前对其进行一些文本性质的操作。它的主要任务包括删除注释、插入被#include指令包含的文件的内容、定义和替换由#define指令定…

C语言:main()函数正确写法

C语言虽然是一门古老的语言,但是其标准一直在完善,所以很多以前支持的语法在到当前已经不能在使用了。 C语言的版本历史 C语言的版本历史: 【K&RC】1978年,Brian Kernighan和Dennis Ritchie合作推出了《…

C语言:控制流语句

C语言中,程序默认的执行顺序是按语句出现的先后顺序按序执行。如果你想要让程序做一些决定,根据不同的情况做不同的事情,例如根据时间打印“早上好”或者“晚上好”,这可以通过控制流语句实现。 分支结构 a?b:c 三…

C语言之Hello World程序编译

C语言基本上大学都教过,但是很多人应该和我一样学习的时候还使用的是Windows平台,对于其中要用到的编译等知识都不了解。今天就针对这种情况来重新学习一遍C语言。 #include <stdio.h> main() { printf("h…

网关协议CGI、FastCGI、WSGI的区别

在部署PHP和Python的WEB应用时,会遇到类似CGI、FastCGI、WSGI、uWSGI等概念。先前对这些概念一直很疑惑,不知道该如何选择。于是抽时间对这部分内容进行了梳理,以下为主要内容: CGI CGI即通用网关接口(Common Ga…

术→技巧, 研发 ·

短文本匹配实战:重复POI识别

项目需求 去除从地图网站抓取的POI数据中的重复数据。示例数据如下: 思考逻辑 POI去重问题,并非简单的文本匹配,按照编辑距离去做,可能会走到沟里去。 不同地方有相同名字的POI点,如: 行政管理中心 人民…

数据, 术→技巧 ·

Elasticsearch中文分词插件安装

Elasticsearch分析器原理 在安装分词工具前我们需要先了解下一个概念:分析器(Analyzer)。分析器是三个顺序执行的组件的结合(字符过滤器,分词器,标记过滤器)。即分词器包含在分析器中。分析器的内部就是一条…

电商网站CTR预估实战

在之前的文章中我们学习了CTR常用模型:FM、FFM和DeepFM,也学习了美团搜索广告CTR预估模型的演变。这篇文章主要从实战的角度,梳理CTR算法的使用方法。 数据准备 KASANDR Data Set Abstract: KASANDR is a novel, …

数据, 术→技巧 ·