所有文章

机器学习算法之Softmax Regression

由于Logistic Regression算法复杂度低、容易实现等特点,在工业界中得到广泛使用,如计算广告中的点击率预估等。但是,Logistic Regression算法主要是用于处理二分类问题,若需要处理的是多分类问题,如手写字识别…

机器学习算法之朴素贝叶斯

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。 贝叶斯定理 贝叶斯定理实际上就是计算“条件概率” 的公式…

地理信息系统之瓦片坐标系

最近抓取了部分百度地图的数据,中间的数据使用的是瓦片经纬度。由于先前对这方面知识没有接触过。今天抽时间整理下,供后续使用。 经纬度与坐标系 地球是一个椭球,Datum是一组用于描述这个椭球的数据集合。最常…

术→技巧, 研发 ·

MySQL存储引擎MyISAM、InnoDB

在使用MySQL的过程中对MyISAM和InnoDB这两个概念存在了些疑问,到底两者引擎有何分别一直是存在我心中的疑问。为了解开这个谜题,搜寻了网络,找到了如下信息: MyISAM是MySQL的默认数据库引擎(5.5版之前)…

数据, 术→技巧, 研发 ·

MySQL命名、设计及使用规范

最近在看MySQL相关的内容,整理如下规范,作为一名刚刚学习MySQL的菜鸟,整理的内容非常的基础,中间可能涉及到有错误的地方,欢迎批评指正,看到有错误的地方期望看官留言。 数据库环境 dev:开发环境,开发…

数据, 术→技巧, 研发 ·

数据分析应该掌握的SQL技能

以下内容是个人整理的分析人员应该掌握的一些SQL技能,相比正常的SQL教程存在不同的侧重点。 一般查询语句 需要掌握的关键词(包含顺序): SELECT FROM JOIN WHERE GROUP BY HAVING ORDER BY LIMIT S…

数据, 术→技巧 ·

深度学习算法之卷积神经网络(CNN)

卷积神经网络简介 传统的BP神经网络与DNN(深度神经网络)不同层神经元的连接方式是“全连接”,也就是这一次层的一个神经元的输入,会接受上一次每一个神经元的输出,这种方式即为“全连接神经网络”。这样的连接方式…

法→原理, 深度学习 ·

多经纬度坐标中心点计算方法

在实际的应用场景,通常会遇到计算多个经纬度中心的需求。而在计算经纬度中心点通常有三种方式,每种方式对应不同的需求。 地理中心点 地理中心点的求解过程非常的简单,即将每个经纬度转化成x,y,z的坐标值。然后…

数据, 术→技巧 ·

中文字体盘点之宋体与仿宋

宋体与仿宋 宋体 宋体(中国大陆一般称宋体;台湾有宋体和明体两种说法,港澳通常称为明体),是汉字印刷字体的风格类别。最初是在复刻临安书棚本时将笔划加以直线化,呈现出硬朗表情的一种字体。笔画有粗细变化…

术→技巧, 设计 ·

机器学习算法之支持向量机SVM

什么是支持向量机(SVM)? 支持向量机(support vector machines, SVM)是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;支持向量机还包括核技巧,这使它…