分类: 数据

地理空间数据格式简介

地理空间数据格式用于存储和描述与地理位置相关的数据。这些数据可以是栅格(图像)数据或矢量数据。不同的格式有各自的特点和适用场景。 以下是一些常见的地理空间数据格式: 矢量数据格式 矢量数据格式…

数据, 术→技巧 ·

地理空间数据分组:mapclassify

mapclassify简介 mapclassify 是一个 Python 库,主要作用是为空间数据提供分类和分级的方法,以便在地图上进行可视化和分析。通过将连续的数值数据分成离散的类别或等级,mapclassify 能够帮助用户更清晰地理解和…

交通数据可视化包TransBigData

TransBigData简介 TransBigData是一个为交通时空大数据处理、分析和可视化而开发的Python包。TransBigData为处理常见的交通时空大数据(如出租车GPS数据、共享单车数据和公交车GPS数据)提供了快速而简洁的方法。T…

地图可视化工具kepler.gl

kepler.gl简介 Kepler.gl 是一个开源的地理空间数据可视化工具,由 Uber 开发并开源。它旨在帮助用户快速、直观地探索和展示大型地理空间数据集。 主要特点 用户友好界面,提供了一个直观的界面,使用…

路径规划问题之旅行商问题

旅行商问题简介 旅行商问题(Traveling Salesman Problem,简称TSP)是路径规划中的一个经典问题。旅行商问题是指一个旅行商人需要拜访N个城市,他必须选择一条路径,使得每个城市只被拜访一次,并最终返回出发城…

数据, 术→技巧 ·

Presto SQL体系化学习

在日常的工作中,使用较多的是Presto,原因是它比Spark快非常多。当然,使用过程中也会遇到一些问题,其中主要的是一些内置函数与Spark SQL存在较大的差异。这里对Presto SQL一个简单的整理。关于Presto的相关内容…

Hive SQL系统化学习

Apache Hive是一个开源的数据仓库框架,用于查询和分析大数据集存储在Hadoop文件系统中。 Hive 提供了一种类 SQL 的查询语言,叫做 HiveQL,它使得熟悉 SQL 的用户可以在 Hive 上查询、汇总和分析数据。同时,还…

数据, 术→技巧 ·

Spark SQL 系统化学习

日常工作很多自动化的任务使用的是Spark运行,这里抽时间地Spark SQL进行系统的学习。 Spark SQL 与Hive SQL的区别 Hive和Spark都是Apache的开源框架,而Hive SQL和Spark SQL是这两种框架上运行的SQL引擎。它…

数据, 术→技巧 ·

统计学基础之推断统计

什么是推断统计? 推断统计是一种通过样本数据推断总体参数的统计方法。它不仅能够根据样本数据对总体参数进行点估计和区间估计,还能够进行假设检验,通过建立统计模型对数据进行解释和预测。 推断统计主要包…

数据, 术→技巧 ·

统计学基础之参数估计

参数估计的基本概念 参数估计是指用样本统计量去估计总体的参数。总体参数通常是未知的,我们通过对一部分样本的观察来对这些未知参数进行估计。 在统计学中,参数和估计量是两个核心概念,它们在进行统计…

数据, 术→技巧 ·