calplot简介 相信很多人都会在 Github 中看到这么一个热图,该热图记录的是 Github 平台使用的日常贡献。在每个日历年的热图中以天为单位采样的时间序列数据。GitHub 的贡献图表示用户在过去几年中所做的贡献数量…
地图提供商瓦片服务地图规则 瓦片地图简介 瓦片地图(Tile Map)是地理信息系统(GIS)和网络地图应用中一种常见的地图显示方式。通过将地图切分成若干小块(称为“瓦片”),用户可以在浏览时仅加载当前视角所需的…
地理空间数据格式用于存储和描述与地理位置相关的数据。这些数据可以是栅格(图像)数据或矢量数据。不同的格式有各自的特点和适用场景。 以下是一些常见的地理空间数据格式: 矢量数据格式 矢量数据格式…
mapclassify简介 mapclassify 是一个 Python 库,主要作用是为空间数据提供分类和分级的方法,以便在地图上进行可视化和分析。通过将连续的数值数据分成离散的类别或等级,mapclassify 能够帮助用户更清晰地理解和…
TransBigData简介 TransBigData是一个为交通时空大数据处理、分析和可视化而开发的Python包。TransBigData为处理常见的交通时空大数据(如出租车GPS数据、共享单车数据和公交车GPS数据)提供了快速而简洁的方法。T…
kepler.gl简介 Kepler.gl 是一个开源的地理空间数据可视化工具,由 Uber 开发并开源。它旨在帮助用户快速、直观地探索和展示大型地理空间数据集。 主要特点 用户友好界面,提供了一个直观的界面,使用…
旅行商问题简介 旅行商问题(Traveling Salesman Problem,简称TSP)是路径规划中的一个经典问题。旅行商问题是指一个旅行商人需要拜访N个城市,他必须选择一条路径,使得每个城市只被拜访一次,并最终返回出发城…
在日常的工作中,使用较多的是Presto,原因是它比Spark快非常多。当然,使用过程中也会遇到一些问题,其中主要的是一些内置函数与Spark SQL存在较大的差异。这里对Presto SQL一个简单的整理。关于Presto的相关内容…
Apache Hive是一个开源的数据仓库框架,用于查询和分析大数据集存储在Hadoop文件系统中。 Hive 提供了一种类 SQL 的查询语言,叫做 HiveQL,它使得熟悉 SQL 的用户可以在 Hive 上查询、汇总和分析数据。同时,还…
日常工作很多自动化的任务使用的是Spark运行,这里抽时间地Spark SQL进行系统的学习。 Spark SQL 与Hive SQL的区别 Hive和Spark都是Apache的开源框架,而Hive SQL和Spark SQL是这两种框架上运行的SQL引擎。它…