数据

空间索引之 Google S2

在空间索引类问题中,一个最普遍而又最重要的问题是:给定你某个点的坐标,你如何能够在海量的数据点中找到他所在的区

Uber H3实战:英国交通事故点聚类

主要流程: 将交通事故的经纬度信息转化为Uber H3 方案一:对交通事故所在的经纬度进行聚类,获取非-1类别

Uber业务预测简介

近年来,机器学习,深度学习和概率编程在精准预测方面显示出巨大潜力。除普通的统计算法外,Uber 还使用这三种技

Python地图可视化之Folium

Folium简介 Folium是一个基于leaflet.js的Python地图库,其中,Leaflet是一个非

中国行政区划边界GeoJSON数据

行政区划相关信息在GIS中算是不可或缺的基础数据,然而由于行政区划经常会进行调整,所以许多网上搜集的已经存在了

Python地图可视化之GeoPandas

GeoPandas简介 GeoPandas是一个开源项目,它的目的是使得在Python下更方便的处理地理空间数

空间索引之Uber H3

网格系统(Grid System)对于分析海量空间数据集,将地球空间划分为可识别的网格单元(cell)至关重要

分层时间记忆HTM学习笔记

分层时间记忆算法(Hierarchical Temporal Memory),全称HTM Cortical L

Expedia异常检测项目Adaptive Alerting

Adaptive Alerting(AA)是Expedia开源的异常检测项目,整个项目也是完整一套监控体系,包

格兰杰因果关系检验学习笔记

格兰杰因果关系检验简介 格兰杰因果关系检验(英语:Granger causality test)是一种假设检定

异常检测包PyCuliarity的使用

时间序列异常检测算法梳理的文章中介绍了Twitter的异常检测工具AnomalyDetection。另外也讲到

Netflix异常检测工具Surus初探

Surus简介 Surus是NetFlix开源的UDFs,是基于pig和hive的数据分析工具。Surus中的