钱魏Way

656篇文章

数据分析应该掌握的SQL技能

以下内容是个人整理的分析人员应该掌握的一些SQL技能,相比正常的SQL教程存在不同的侧重点。 一般查询语句 需要掌握的关键词(包含顺序): SELECT FROM JOIN WHERE GROUP BY HAVING ORDER BY LIMIT S…

数据, 术→技巧 ·

深度学习算法之卷积神经网络(CNN)

卷积神经网络简介 传统的BP神经网络与DNN(深度神经网络)不同层神经元的连接方式是“全连接”,也就是这一次层的一个神经元的输入,会接受上一次每一个神经元的输出,这种方式即为“全连接神经网络”。这样的连接方式…

法→原理, 深度学习 ·

多经纬度坐标中心点计算方法

在实际的应用场景,通常会遇到计算多个经纬度中心的需求。而在计算经纬度中心点通常有三种方式,每种方式对应不同的需求。 地理中心点 地理中心点的求解过程非常的简单,即将每个经纬度转化成x,y,z的坐标值。然后…

数据, 术→技巧 ·

中文字体盘点之宋体与仿宋

宋体与仿宋 宋体 宋体(中国大陆一般称宋体;台湾有宋体和明体两种说法,港澳通常称为明体),是汉字印刷字体的风格类别。最初是在复刻临安书棚本时将笔划加以直线化,呈现出硬朗表情的一种字体。笔画有粗细变化…

术→技巧, 设计 ·

机器学习算法之支持向量机SVM

什么是支持向量机(SVM)? 支持向量机(support vector machines, SVM)是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;支持向量机还包括核技巧,这使它…

聚类算法之Label Propagation

标签传播算法(label propagation)简介 半监督学习 机器学习可以大体分为三大类:监督学习、非监督学习和半监督学习。 监督学习可以认为是我们有非常多的labeled标注数据来train一个模型,期待这个模型能学…

中文字体盘点之黑体

黑体是汉字的一种字体风格。它的特点是笔画厚度均匀,和拉丁字母的无衬线体(英语:sans-serif)属于同类。由于其醒目的特点,常用于标题、导语、标志、界面字体等等。由于汉字笔划多,小字的黑体清晰度较差,所以…

术→技巧, 设计 ·

关联规则算法之Apriori

Apriori简介 集体智慧(Collective Intelligence) 单一个体所做出的决策往往会比起多数决的决策来的不精准,集体智慧是一种共享的或者群体的智能,以及集结众人的意见进而转化为决策的一种过程。它是从许多个体…

聚类算法之Affinity Propagation(AP)

Affinity Propagation算法简介 AP(Affinity Propagation)通常被翻译为近邻传播算法或者亲和力传播算法。AP算法的基本思想是将全部数据点都当作潜在的聚类中心(称之为exemplar),然后数据点两两之间连线构成一个网…

Python解析拼音输入法词库

目前类似搜狗输入法、百度输入法等最大的亮点是有较好的词库,而这些词库除了用在搜索上还可以用在及其场景,比如说分词。目前每种输入法的词库都有自己的格式,今天我们就来研究下,如何反编译这些词库,将这些词…

数据, 术→技巧 ·